Người dùng hiện có thể ngăn Facebook lấy dữ liệu cá nhân để đào tạo AI

Người dùng Internet có thể xóa thông tin cá nhân đang bị Meta thu thập cho việc đào tạo mô hình AI tổng quát.

Các mô hình AI hiện nay cần nguồn dữ liệu đầu vào khổng lồ về “học”. Những dữ liệu này được thu thập từ nhiều nguồn trên mạng như hình ảnh, bài viết, bình luận… và trong đó có cả thông tin cá nhân của người dùng mạng xã hội.

Meta cung cấp cho người dùng tùy chọn thay đổi hoặc xóa bất kỳ dữ liệu cá nhân nào của họ mà công ty sử dụng để đào tạo ngôn ngữ lớn và mô hình AI liên quan. Theo cập nhật mới nhất, người dùng có thể vào trang trợ giúp, truy cập mục Quyền của chủ thể dữ liệu đối với AI tổng quát.

Tại đây có ba lựa chọn gồm: “Tôi muốn truy cập, tải xuống hoặc sửa thông tin cá nhân bất kỳ mà các bên thứ ba cung cấp dùng cho AI tổng quát”; “Tôi muốn xóa mọi thông tin cá nhân mà các bên thứ ba cung cấp để dùng cho AI tổng quát” và “Ý kiến khác”.

Với tùy chọn đầu tiên, người dùng có thể tải về dữ liệu đã bị “bên thứ ba” thu thập và xem xét trước khi đồng ý cho Meta dùng chúng để đào tạo AI. Trong khi đó, tùy chọn thứ hai yêu cầu nền tảng xóa những gì đang lưu trữ. Nếu có yêu cầu khác, người dùng cần cung cấp họ tên, quốc gia cư trú và email cùng ý kiến của mình, sau đó gửi đi.

Sau khi chọn một trong ba tùy chọn, họ cũng cần vượt qua bài kiểm tra kiểm tra bảo mật. Tuy nhiên, theo CNBC, một số người phản ánh không thể hoàn thành biểu mẫu vì “có vẻ như lỗi phần mềm”.

Dữ liệu nào đang được Meta thu thập?

Meta định nghĩa thông tin của bên thứ ba là dữ liệu “được cung cấp công khai trên Internet hoặc các nguồn được cấp phép”. Hãng cho biết loại thông tin này “có thể đại diện cho một số trong số hàng tỷ mẫu dữ liệu” được sử dụng để đào tạo AI bằng cách dùng những gì thu thập được cho tổng hợp, dự đoán và tạo ra nội dung mới.

Trong bài đăng blog ngày 30/8, Meta cho biết họ lấy thông tin công khai này, bên cạnh việc dùng dữ liệu được cấp phép từ các đối tác.

“Để dạy mô hình theo cách hiệu quả, chúng tôi cần một lượng dữ liệu lớn. Do đó, chúng tôi dùng kết hợp các nguồn khác nhau trong quá trình đào tạo. Những nguồn này gồm thông tin công khai trên mạng, thông tin được cấp phép, cũng như thông tin từ các sản phẩm và dịch vụ của Meta”, bài viết nêu.

Trong quá trình thu thập, Meta có thể lấy được cả thông tin cá nhân. Chẳng hạn một bài viết công khai có thể chứa thông tin tác giả. Công ty nói trong quá trình lấy dữ liệu, quyền riêng tư của người dùng được đảm bảo và có đội ngũ chuyên trách để làm điều này.

Meta hiện vận hành mô hình ngôn ngữ lớn LLaMA, được công bố đầu năm nay. Nó hoạt động dưới dạng mở, cho phép nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí.

Phát ngôn viên Meta cho biết phiên bản LLaMA thế hệ mới, LLaMA 2, chưa sử dụng dữ liệu của người dùng trên các nền tảng như Facebook, Instagram của Meta để huấn luyện AI (trí tuệ nhân tạo).

“Tùy vào nơi sinh sống, mọi người có thể thực hiện quyền làm chủ dữ liệu, có thể phản đối chúng tôi khai thác một số dữ liệu nhất định để đào tạo AI”, phát ngôn viên Meta nói. “Họ có quyền biết thông tin của họ đang được chúng tôi sử dụng thế nào”.

Đến nay, hầu hết công ty công nghệ như Meta, Microsoft, Google hay OpenAI vẫn thu thập dữ liệu công khai trên Internet để phục vụ quá trình huấn luyện trí tuệ nhân tạo AI. Tuy nhiên, giới chuyên môn nhiều lần đặt câu hỏi về việc lượng lớn thông tin thu được đang sử dụng thế nào.

Tuần trước, liên minh gồm các cơ quan bảo vệ dữ liệu từ Anh, Canada, Thụy Sĩ và một số quốc gia khác đưa ra tuyên bố chung rằng các công ty công nghệ lớn như Meta, Alphabet, ByteDance (TikTok), X (Twitter), Microsoft cần phải tuân theo luật bảo vệ dữ liệu và quyền riêng tư tùy theo những nơi đang hoạt động. Nhóm khuyến cáo người dùng cần có ý thức cao hơn trong việc kiểm soát và bảo vệ thông tin đưa lên Internet.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Hà Anh | MarketingTrips

Người dùng hiện có thể ngăn Facebook lấy dữ liệu cá nhân để đào tạo AI

Dữ liệu nào đang được Meta thu thập?

Bài viết liên quan

Sáu năm giữa bão crypto: Giải phẫu hành trình một sàn giao dịch từ startup đến hệ sinh thái đa tài sản

Google Chrome âm thầm tải xuống 4 GB dữ liệu mô hình AI trực tiếp về máy tính

Google vừa công bố tích hợp AI vào trình duyệt Chrome giúp tóm tắt nội dung và gửi email

Gmail cho phép thay đổi địa chỉ email (thay vì phải lập tài khoản mới)

Lý do OpenAI đóng cửa ứng dụng tạo video Sora từng gây sốt khi mới ra mắt

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

ZORA ra mắt “thị trường theo dõi” ATTENTION MARKETS để dự đoán xu hướng internet

OpenAI: Mô hình thu phí cố định của ChatGPT sắp thay đổi

Bitcoin đang chạy theo hướng tách khỏi thị trường truyền thống

Nghiên cứu: Quảng cáo TikTok thúc đẩy tích cực doanh thu phòng vé

OpenAI vừa cho ra mắt mô hình GPT-5.4 (GPT-5.4 Thinking) với khả năng suy luận nhanh

Báo cáo The Connected Consumer: Các nền tảng AI được sử dụng phổ biến nhất tại Việt Nam

Nổi bật

Doanh thu Shopee đạt hơn 5 tỷ USD trong quý 1 năm 2026 (công ty mẹ đạt hơn 7 tỷ USD)

Nhân viên của mạng xã hội Facebook phản đối việc bị theo dõi chuột và bàn phím

Golden Gate vẫn đang gánh khoản lỗ hơn 70 tỷ từ thương vụ mua lại The Coffee House

Chuỗi trà sữa tại Việt Nam được định giá tới 2 tỷ USD

Chagee Việt Nam phản hồi về việc tranh chấp tên miền chagee.vn

Sáu năm giữa bão crypto: Giải phẫu hành trình một sàn giao dịch từ startup đến hệ sinh thái đa tài sản

Google Chrome âm thầm tải xuống 4 GB dữ liệu mô hình AI trực tiếp về máy tính

Đất Xanh Group đổi tên thành Bluemarq Group

Mới nhất

Doanh thu Shopee đạt hơn 5 tỷ USD trong quý 1 năm 2026 (công ty mẹ đạt hơn 7 tỷ USD)

Nhân viên của mạng xã hội Facebook phản đối việc bị theo dõi chuột và bàn phím

Golden Gate vẫn đang gánh khoản lỗ hơn 70 tỷ từ thương vụ mua lại The Coffee House

Chuỗi trà sữa tại Việt Nam được định giá tới 2 tỷ USD

Chagee Việt Nam phản hồi về việc tranh chấp tên miền chagee.vn

Đọc nhiều

Một tập đoàn bán lẻ đa kênh 17.000 nhân sự vừa phá sản

X là gì? Hướng dẫn sử dụng mạng xã hội X cho người mới

Hướng dẫn sử dụng Tether (USDT) tại Việt Nam

Carlsberg Việt Nam bị phạt vì gây nhầm lẫn cho khách hàng về sản phẩm trên bao bì (Huda, Huda Gold và Halida)

Benchmark là gì? Thấu hiểu về Benchmark trong Marketing