Những lo ngại khi ứng dụng BigData

Một lượng dữ liệu khổng lồ về con người đang được chính phủ, doanh nghiệp thu thập hằng ngày. Nhưng thật đáng lo ngại khi dữ liệu đó không nằm trong sự kiểm soát.

Mỗi ngày có 2,5 quintillion byte (2,5 tỷ Gigabyte) dữ liệu được tạo ra. Khi cảm biến ngày càng nhiều và luôn tìm cách lấy tất cả mọi thứ từ điện thoại cho đến thiết bị gia dụng của bạn. Điều này có thể mang đến cái nhìn sâu sắc vào các hành vi và hành động, kế hoạch của từng người cho đến từng tổ chức. Nhưng, đồng thời nó cũng làm biến mất những gì riêng tư vì tất cả mọi thứ đều có thể trực tuyến và bị lấy đi mà không ai biết.

Thông tin chính là sức mạnh vì nó đại diện cho quyền lực và tiền bạc. Mọi thông tin đều có giá trị và luôn được trả hậu hĩnh theo tầm quan trọng, dù đó là bí mật thương mại hay số thẻ tín dụng, địa chỉ email, mật khẩu… Cũng vì thế những thông tin mà người tiêu dùng cho là riêng tư thì trên thực tế khá dễ dàng tiếp cận. Và không có kho lưu trữ dữ liệu nào trên thế giới mà không được chia sẻ.

Theo nghiên cứu mới nhất của công ty bảo mật Terbium Labs thì có tới 20% dân số đã bị ảnh hưởng bởi việc vi phạm dữ liệu. Khi một địa chỉ email bị xâm nhập thì người ta tìm thấy thông tin bị rò rỉ ở hơn 50 nguồn khác nhau. Điều này cho thấy thông tin cá nhân đang được phổ biến rộng rãi và mọi người chưa đánh giá đúng những dữ liệu của bản thân mình.

Đôi lúc những lời cảnh báo có vẻ hoang đường và quá cường điệu theo suy nghĩ của người dùng bình thường, nhưng đây là điều thực sự đáng quan tâm.

 

Tình trạng mất cắp dữ liệu đáng báo động

Khi dữ liệu là vàng

Tại Mỹ, tính đến cuối tháng 9/2015 đã có 5,6 triệu dấu vân tay của nhân viên liên bang đã bị đánh cắp. Cùng lúc đó, giới chức Mỹ và các chuyên gia bảo mật tin rằng, dữ liệu số an sinh xã hội của hơn 21,5 triệu nhân viên tại Cục quản lý nhân sự Mỹ - OPM trước đó cũng đã bị phía hacker Trung Quốc xâm phạm. Hiện tại những dấu vân tay này có thể được nhận rộng thông qua các máy in 3D sẵn có trong thị trường. Đây được xem là mối nguy hại đối với vấn đề an ninh của một quốc gia.

Cũng khoảng thời gian này, 3 người đàn ông, trong đó có 2 người đến từ Việt Nam đã bị Bộ Tư pháp Mỹ bắt giữ sau khi đánh cắp 1 tỷ địa chỉ email tại Mỹ. Theo Bộ Tư pháp Mỹ, đây là vụ xâm phạm dữ liệu lớn nhất lịch sử Internet. Không chỉ ăn cắp dữ liệu mà các tin tặc này còn tấn công vào hạ tầng nhằm gửi hàng loạt email spam, thu lợi nhuận từ các lưu lượng truy cập vào các website được chỉ định. Nguồn dữ liệu đánh cắp từ vụ án OPM hay Công ty Bảo hiểm nhân thọ Anthem hồi  tháng 2/2015 bị nghi ngờ là đang được mua bán trao đổi trên thị trường đen. Công ty cung cấp dịch vụ quản trị quy trình tín dụng Experian cũng đã để thông tin của hơn 15 triệu người dùng từ 1/9/2013 đến 16/9/2015 đã rơi vào tay tin tặc. Thông tin bị đánh cắp bao gồm tên, địa chỉ, số điện thoại, ngày sinh, số hộ chiếu, bằng lái xe và đặc biệt là số an sinh xã hội.

Đôi lúc thẻ tín dụng không phải là mục đích của tin tặc, website gây vốn từ cộng đồng Patreon đã bị lấy đi 15 GB dữ liệu, trong đó có tên, địa chỉ và e-mail của 2,3 triệu người dùng. Tin tặc tập trung tiếp cận cácdữ liệu mã hóa khác như mật khẩu truy cập, số an sinh xã hội và thông tin khai thuế, còn thông tin thẻ ngân hàng lại được bỏ qua. Giống như vậy, thông tin tên và địa chỉ của 4,6 triệu khách hàng của công ty môi giới chứng khoán trực tuyến hàng đầu của Mỹ Scottrade cũng  trở thành món hàng đắt giá. Tất cả đó chưa phải là gì so với vụ án hacker đánh cắp thông tin liên lạc của 76 triệu khách hàng JPMorgan Chase, 7 triệu doanh nghiệp nhỏ vào tháng 10/2014, mọi thông tin về tên, địa chỉ, số điện thoại, email của họ đều bị lộ.

 

Có thể ai đó đang theo dõi chúng ta

 

Mắt xích yếu gây ra thảm họa

Ngày 24/12/2015, tập đoàn khách sạn Hilton xác nhận rằng những kẻ tấn công không rõ đã đột nhập vào một số hệ thống POS để lấy trộm thông tin thẻ thanh toán của khách thuê phòng. Tuyên bố của Hilton cho rằng tin tặc đã truy cập vào hệ thống POS của tập đoàn với thời gian khoảng 17 tuần kéo dài ở 2 thời điểm khác nhau, đầu tiên giữa tháng 11 và tháng 12/2014 và lần thứ hai kéo dài từ tháng 4 đến tháng 7/2015. Cuộc tấn công lần này cũng chỉ ra hệ thống của khách sạn đang là mục tiêu mới mà tin tặc quan tâm đến. Hilton là chuỗi khách sạn thứ hai công bố bị tin tặc tấn công. Chỉ cách đó vài ngày, khách sạn Starwood - chủ sở hữu của các thương hiệu như Sheraton, Westin, và W - tiết lộ rằng tin tặc đã xâm phạm các hệ thống POS tại hơn hai địa điểm thuộc tập đoàn. Các điểm thanh toán POS luôn được đánh giá là một trong những mắt xích yếu trong toàn hệ thống hạ tầng. Ngoài ra, việc các hệ thống thanh toán phần lớn vẫn sử dụng hệ điều hành Window XP hoặc cũ hơn là điều đáng quan ngại.

Tuy nhiên xét về khía cạnh phi kĩ thuật thì mạng xã hội là nguồn cung cấp thông tin dành cho tin tặc. Lượng thông tin chúng ta có thể dễ dàng tìm thấy trên một người từ Facebook, LinkedIn, Twitter, và bài viết trên blog có khối lượng khổng lồ. Điều này đặc biệt nguy hiểm đối với những người nắm quyền quản trị một cơ sở dữ liệu nào đó. Chức vụ càng cao, quyền hành càng lớn càng dễ dàng trở thành mục tiêu được tin tặc nhắm đến. Các chuyên gia an ninh thông tin tìm thấy thông tin được bảo mật của Bill Gates ở hàng chục hoặc hàng trăm địa chỉ web đen. Hay như tài khoản email cá nhân của Giám đốc Cơ quan Tình báo trung ương Mỹ (CIA) John Brennan đã bị tin tặc tấn công và đánh cắp một số tài liệu nhạy cảm, trong đó có một hồ sơ 47 trang ở mức tuyệt mật.

 

POS là mắt xích yếu nhất trong hệ thống kinh doanh

 

Chi tiêu cá nhân tiết lộ bạn là ai

Ngành công nghiệp thẻ tín dụng sử dụng các thuật toán dự đoán và phân tích hồi quy thống kê để nhằm xác định những người có khả năng và không có khả năng chi trả trả các hóa đơn của họ. Số lượng dữ liệu quan trọng mà các nhà cung cấp thẻ đang sử dụng có thể làm chúng ta  ngạc nhiên. Để tìm ra bạn là người thế nào trong số 15 triệu người được chọn để dự đoán mỗi năm, tất cả các loại dữ liệu được thu thập, từ những khoản tiền đã trả, khoản tiền thu nhập, khoản vay cho đến chi tiêu trong gia đình. Không chỉ lịch sử thanh toán mà những liệu bên lề như gồm tình trạng hôn nhân, tuổi tác, quyền sở hữu xe, các khoản thanh toán được thực hiện cho chiếc xe đó, những loại máy tính và máy ảnh bạn sử dụng, và thậm chí cả lịch sử kỳ nghỉ. Có ít nhất 160 vấn đề về cá nhân của người được chọn để phân tích nhằm xem xét có nên cung cấp thẻ tín dụng hay không. 

Đó là cách thức biến thông tin vô bổ trở thành vàng. Xem xét một ông lớn khác của Mỹ là Target (nhà bán lẻ nổi tiếng với vụ bị hacker tấn công từ hệ thống sưởi, thông gió) khi họ có những động thái chăm sóc người phụ nữ mang bầu. Một trong những thống kê của nhà bán lẻ này nhằm xác định phụ nữ mang thai đã sử dụng dữ liệu từ các cửa hàng mà họ thu thập được từ nhiều nguồn khác nhau. Từ dữ liệu đó, họ có thể dự đoán được khả năng mang thai cũng như thời gian được chuẩn đoán. Target sử dụng các thông tin này để gửi phiếu giảm giá tương ứng với các giai đoạn khác nhau của thai kì. Điều này chứng tỏ nhà bán lẻ có thể hiểu rõ bạn hơn chính những người thân bên cạnh mình. Các doanh nghiệp luôn tìm cách để thu hút khách hàng mới. Để làm được điều đó, họ mua dữ liệu từ các nhà môi giới, sử dụng chiến thuật tinh vi nhắm vào  mục tiêu trực tuyến, và lợi dụng các mối quan hệ với các công ty trong ngành khác hoặc các ngành có cơ sở khách hàng bổ sung cho riêng mình.

Có lẽ điều đáng sợ nhất là thông tin cá nhân mà mỗi người không kiểm soát được. Dữ liệu được cung cấp khi cần thiết, hoặc theo thoả thuận với chính phủ, các tập đoàn, cá nhân và sau đó nó có thể được bán, giao dịch, rò rỉ, hoặc bị đánh cắp. Thông qua các hành vi cố ý và vô ý của bên thứ ba, dữ liệu nhạy cảm có thể tồn tại ở một nơi nào đó. Trong thời đại ngày nay, chúng ta gần như không thể bị ngắt kết nối. Khi bạn phải thanh toán một hóa đơn,  gặp gỡ bác sĩ, nhấc điện thoại lên… đã tạo nên dữ liệu ở đâu đó.

Công nghệ quyết định vận mệnh

Xe ô tô tự lái của Google đã đi được hơn 1 triệu dặm. Những chiếc xe này có mặt ở 11 tai nạn nhỏ và dường như tất cả được gây ra bởi những người lái xe khác. Trong năm 2009, trung bình của con người là 185 vụ tai nạn trên 100 triệu dặm xe đi và Google đạt ngưỡng 100 triệu dặm/1 vụ tai nạn. Xe tự lái không say, không buồn ngủ hay mất tập trung những tác nhân có xu hướng gây ra tai nạn ô tô như khi con người đang lái xe.  Xe ô tô của Google có thể bị tấn công ở một số điểm liên quan đến công nghệ hay điểm hạn chế trong việc quyết định đường đi.

Chrysler thu hồi 1,4 triệu xe ô tô có vấn đề về máy tính điều khiển UConnect. Việc thu hồi đã được công bố sau khi nhà nghiên cứu bảo mật nắm quyền kiểm soát các bảng điều khiển, tay lái, phanh, và truyền tải của một chiếc xe Jeep. Chúng ta không nghĩ rằng những chiếc xe đó như một máy tính nhưng trên thực tế mỗi xe trung bình tạo ra khoảng 25 Gigabyte dữ liệu mỗi giờ. Một chiếc xe thực sự là một hệ điều hành, mà đã vậy thì nó có thể bị bẻ khóa bất cứ lúc nào.

Một quyết định đang phải xem xét xung quanh việc lập trình một chiếc xe tự lái hoặc là hy sinh cuộc sống của những người đi ô tô hay cuộc sống của những người khác. Wah-Kwan Lin, nhà khoa học dữ liệu cho rằng “Đây là một tình huống mà bạn đang cho phép công nghệ, và những người đứng sau công nghệ quyết định các tình huống cuộc sống-hay-chết. Trên thực tế, việc xây dựng các thuật toán và các thông số lập trình nên được hướng dẫn cụ thể. Dữ liệu mang đến những thông số giúp chúng ta sử dụng để quyết định giá trị của cuộc sống.

 

Tương lai xe ô tô

Bí mật không còn là bí mật

Thành phố thông minh hơn, cảm biến, máy quay sẽ xuất hiện khắp mọi nơi. Một trong số đó được sử dụng để nhận dạng khuôn mặt phục vụ cho việc thực thi pháp luật.  Nhận dạng khuôn mặt, phân tích chuyển động, và phân tích tư thế đang được kết hợp với mục đích của hồ sơ về hành vi. Các nhân viên an ninh có thể sử dụng thông tin đó để phòng ngừa tội phạm. Nếu ai đó đang di chuyển lén lút xung quanh sân bay và hành xử một cách đáng ngờ, và điều đó bị phát hiện bởi hệ thống sử dụng Machine Learning và thuật toán khác. Điều này diễn ra rất tích cực nhưng đồng nghĩa với việc ai đó có thể đang theo dõi bạn.

Theo PCWorldVN

Thêm bình luận

Plain text

  • Không được dùng mã HTML.
  • Các địa chỉ web và email sẽ tự động được chuyển sang dạng liên kết.
  • Tự động ngắt dòng và đoạn văn.