Skip to main content

Thẻ: Llama 2

Giám đốc AI của Meta: Gieo rắc nỗi sợ về AI chỉ là chiến lược để các công ty lớn vận động hành lang

Yann LeCun, Giám đốc AI tại Meta, cho rằng việc gieo rắc nỗi sợ hãi chỉ là chiến lược để các công ty lớn vận động hành lang, từ đó thắt chặt quy định và bóp nghẹt những dự án, ý tưởng nghiên cứu mới trong lĩnh vực này.

Giám đốc AI của Meta: Gieo rắc nỗi sợ về AI chỉ là chiến lược để các công ty lớn vận động hành lang
Giám đốc AI của Meta: Gieo rắc nỗi sợ về AI chỉ là chiến lược để các công ty lớn vận động hành lang

Trả lời Forbes ngày 30/11, LeCun cho rằng việc ChatGPT ra mắt có thể được ví như “sự xuất hiện lần hai của Đấng cứu thế” và tác động của chatbot này tới cộng đồng là “một bất ngờ lớn với mọi người, bao gồm cả đội ngũ OpenAI”.

“Dù không phải sản phẩm của một công ty công nghệ lớn, mọi người vẫn bị ấn tượng bởi ChatGPT và bắt đầu sử dụng nó”, ông nói.

Thống kê cho thấy ChatGPT là một trong những ứng dụng phổ biến nhanh nhất mọi thời đại. Vào ngày ra mắt 30/11/2022, trang web chat.openai.com ngay lập tức thu hút 153.000 người truy cập. Hết tuần đầu tiên, số lượt truy cập tăng đến 15,5 triệu và cán mốc 58 triệu trong tuần thứ hai. Theo công ty phân tích dữ liệu Similar Web, sản phẩm của OpenAI đã thu hút hơn 100 triệu người dùng trong hai tháng.

ChatGPT xuất hiện đã tạo ra sự bùng nổ về lĩnh vực trí tuệ nhân tạo, kéo nhiều gã khổng lồ công nghệ vào cuộc đua phát triển AI. Cũng theo LeCun, sau một cuộc tranh luận nội bộ lớn vào tháng 7, đích thân CEO Mark Zuckerberg đã yêu cầu nhóm nghiên cứu AI phát hành mô hình ngôn ngữ lớn Llama 2 dưới dạng mã nguồn mở, cho phép sử dụng miễn phí.

Ngoài ra, Meta cũng công bố nhiều sản phẩm AI khác, ví dụ trợ lý ảo dựa trên hình mẫu của những người nổi tiếng, để tăng sức cạnh tranh với các đối thủ.

Trong bài đăng trên mạng xã hội X vào tháng 10, Yann Lecun cũng bày tỏ quan điểm ChatGPT và AI sẽ mang tới những tiến bộ và điều tốt đẹp, thay vì sự hủy diệt như nhiều chuyên gia thường cảnh báo. Ông cho rằng việc gieo rắc nỗi sợ hãi chỉ là chiến lược để các công ty lớn vận động hành lang, từ đó thắt chặt quy định và bóp nghẹt những dự án, ý tưởng nghiên cứu mới trong lĩnh vực này.

“Nếu chiến dịch vận động thành công, chúng ta sẽ đối mặt với thảm họa thực sự là công nghệ AI bị kiểm soát bởi số ít tổ chức lớn. Khi đó, những đơn vị khác có ý định nghiên cứu AI sẽ bị xem là thành phần kém năng lực, liều lĩnh, có nguy cơ tự hủy hoại hoặc dẫn đến hậu quả xấu. Nhưng sự thực không phải vậy”, ông nói.

Tại hội nghị VivaTech diễn ra ở Paris tháng 6, nhà khoa học trưởng của Meta nói việc AI thống trị con người là thiếu thực tế. Những chatbot như ChatGPT vẫn có hạn chế lớn là chỉ được đào tạo trên văn bản, không thể nắm bắt hoàn toàn trải nghiệm của con người. Do đó, ông nhận định nhiều chuyên gia chỉ cố tạo dựng nỗi sợ xung quanh mối nguy về AI.

Lecun tin AI sẽ phát triển tốt hơn khi có sự tham gia của nhiều lực lượng khác nhau. Trong tương lai, hệ thống trí tuệ nhân tạo sẽ trở thành nơi lưu trữ tất cả kiến thức và văn hóa của nhân loại. Do đó, những nền tảng này phải luôn trong trạng thái “mở” để bất cứ ai cũng có thể truy cập miễn phí, tương tự cách hoạt động của Wikipedia.

“Công nghệ AI tiến bộ nhờ vào những cá nhân trong chúng ta”, ông nói. “Trong trường hợp AI nguồn mở bị cấm tồn tại, chắc chắn một giải pháp thay thế nào đó sẽ lại được tạo ra”.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Theo VnExpress

Người dùng hiện có thể ngăn Facebook lấy dữ liệu cá nhân để đào tạo AI

Người dùng Internet có thể xóa thông tin cá nhân đang bị Meta thu thập cho việc đào tạo mô hình AI tổng quát.

Người dùng hiện có thể ngăn Facebook lấy dữ liệu cá nhân để đào tạo AI
Người dùng hiện có thể ngăn Facebook lấy dữ liệu cá nhân để đào tạo AI

Các mô hình AI hiện nay cần nguồn dữ liệu đầu vào khổng lồ về “học”. Những dữ liệu này được thu thập từ nhiều nguồn trên mạng như hình ảnh, bài viết, bình luận… và trong đó có cả thông tin cá nhân của người dùng mạng xã hội.

Meta cung cấp cho người dùng tùy chọn thay đổi hoặc xóa bất kỳ dữ liệu cá nhân nào của họ mà công ty sử dụng để đào tạo ngôn ngữ lớn và mô hình AI liên quan. Theo cập nhật mới nhất, người dùng có thể vào trang trợ giúp, truy cập mục Quyền của chủ thể dữ liệu đối với AI tổng quát.

Tại đây có ba lựa chọn gồm: “Tôi muốn truy cập, tải xuống hoặc sửa thông tin cá nhân bất kỳ mà các bên thứ ba cung cấp dùng cho AI tổng quát”; “Tôi muốn xóa mọi thông tin cá nhân mà các bên thứ ba cung cấp để dùng cho AI tổng quát” và “Ý kiến khác”.

Với tùy chọn đầu tiên, người dùng có thể tải về dữ liệu đã bị “bên thứ ba” thu thập và xem xét trước khi đồng ý cho Meta dùng chúng để đào tạo AI. Trong khi đó, tùy chọn thứ hai yêu cầu nền tảng xóa những gì đang lưu trữ. Nếu có yêu cầu khác, người dùng cần cung cấp họ tên, quốc gia cư trú và email cùng ý kiến của mình, sau đó gửi đi.

Sau khi chọn một trong ba tùy chọn, họ cũng cần vượt qua bài kiểm tra kiểm tra bảo mật. Tuy nhiên, theo CNBC, một số người phản ánh không thể hoàn thành biểu mẫu vì “có vẻ như lỗi phần mềm”.

Dữ liệu nào đang được Meta thu thập?

Meta định nghĩa thông tin của bên thứ ba là dữ liệu “được cung cấp công khai trên Internet hoặc các nguồn được cấp phép”. Hãng cho biết loại thông tin này “có thể đại diện cho một số trong số hàng tỷ mẫu dữ liệu” được sử dụng để đào tạo AI bằng cách dùng những gì thu thập được cho tổng hợp, dự đoán và tạo ra nội dung mới.

Trong bài đăng blog ngày 30/8, Meta cho biết họ lấy thông tin công khai này, bên cạnh việc dùng dữ liệu được cấp phép từ các đối tác.

“Để dạy mô hình theo cách hiệu quả, chúng tôi cần một lượng dữ liệu lớn. Do đó, chúng tôi dùng kết hợp các nguồn khác nhau trong quá trình đào tạo. Những nguồn này gồm thông tin công khai trên mạng, thông tin được cấp phép, cũng như thông tin từ các sản phẩm và dịch vụ của Meta”, bài viết nêu.

Trong quá trình thu thập, Meta có thể lấy được cả thông tin cá nhân. Chẳng hạn một bài viết công khai có thể chứa thông tin tác giả. Công ty nói trong quá trình lấy dữ liệu, quyền riêng tư của người dùng được đảm bảo và có đội ngũ chuyên trách để làm điều này.

Meta hiện vận hành mô hình ngôn ngữ lớn LLaMA, được công bố đầu năm nay. Nó hoạt động dưới dạng mở, cho phép nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí.

Phát ngôn viên Meta cho biết phiên bản LLaMA thế hệ mới, LLaMA 2, chưa sử dụng dữ liệu của người dùng trên các nền tảng như Facebook, Instagram của Meta để huấn luyện AI (trí tuệ nhân tạo).

“Tùy vào nơi sinh sống, mọi người có thể thực hiện quyền làm chủ dữ liệu, có thể phản đối chúng tôi khai thác một số dữ liệu nhất định để đào tạo AI”, phát ngôn viên Meta nói. “Họ có quyền biết thông tin của họ đang được chúng tôi sử dụng thế nào”.

Đến nay, hầu hết công ty công nghệ như Meta, Microsoft, Google hay OpenAI vẫn thu thập dữ liệu công khai trên Internet để phục vụ quá trình huấn luyện trí tuệ nhân tạo AI. Tuy nhiên, giới chuyên môn nhiều lần đặt câu hỏi về việc lượng lớn thông tin thu được đang sử dụng thế nào.

Tuần trước, liên minh gồm các cơ quan bảo vệ dữ liệu từ Anh, Canada, Thụy Sĩ và một số quốc gia khác đưa ra tuyên bố chung rằng các công ty công nghệ lớn như Meta, Alphabet, ByteDance (TikTok), X (Twitter), Microsoft cần phải tuân theo luật bảo vệ dữ liệu và quyền riêng tư tùy theo những nơi đang hoạt động. Nhóm khuyến cáo người dùng cần có ý thức cao hơn trong việc kiểm soát và bảo vệ thông tin đưa lên Internet.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Hà Anh  | MarketingTrips   

Llama 2 là gì? Toàn diện về mô hình ngôn ngữ lớn Llama 2

Meta vừa kết hợp với Microsoft giới thiệu Llama 2, mô hình AI (trí tuệ nhân tạo) mới với nhiều khả năng hơn so với mô hình Llama (Large Language Model Meta AI) cũ, vậy Llama 2 là gì và có gì mới so với các thế hệ trước đó.

Llama 2
Llama 2 là gì? Tìm hiểu mô hình AI mới của Meta và Microsoft

Theo đó, khi các mô hình AI tổng quát (Generative AI) không ngừng phát triển, Meta vừa kết hợp với Microsoft cho ra mắt Llama 2, một mô hình AI thế hệ mới với nhiều năng lực mới hơn so với phiên bản tiền nhiệm trước đó là Llama.

Llama 2 là gì? Mô hình AI (trí tuệ nhân tạo) Llama 2 của Meta có gì mới?

LLama là từ viết tắt của Large Language Model Meta AI, có nghĩa là mô hình ngôn ngữ lớn do Meta AI thuộc Meta (công ty mẹ của Facebook, Instagram, WhatsApp, Threads…phát triển) phát triển. Llama 2 là phiên bản mới nhất của Llama.

Theo giới thiệu từ chính Meta, Llama 2 là mô hình AI thế hệ mới được đào tạo dựa trên sự kết hợp của các dữ liệu có sẵn công khai, Meta tuyên bố rằng hiệu suất của Llama 2 hiện mạnh hơn đáng kể so với thế hệ Llama trước đó.

Llama 2 là thế hệ tiếp theo của Llama — một tập hợp các mô hình AI có thể được sử dụng để tạo văn bản (text) hay các đoạn mã (code) khi chúng nhận được cái gọi là “lời nhắc” (hoạt động tương tự như cách người dùng nhập các từ khoá vào thanh tìm kiếm trên các công cụ tìm kiếm).

Trái ngược với các mô hình AI khác hiện có, mô hình AI Llama 2 của Meta sẽ được cung cấp miễn phí cho hoạt động nghiên cứu và sử dụng cho mục đích thương mại, điều này có nghĩa là thay vì chỉ được sử dụng riêng cho Meta, các cá nhân và tổ chức khác đều có quyền truy cập vào Llama 2 để vừa sử dụng, nghiên cứu lẫn phát triển (mã nguồn mở).

Ngoài ra, nhờ vào mối quan hệ đối tác với Microsoft, Meta cho biết Llama 2 cũng được tối ưu hóa cho Windows, điện thoại thông minh và PC thông qua hệ thống chip Snapdragon của gã khổng lồ Qualcomm. (Qualcomm cho biết nền tảng sẽ đưa Llama 2 lên các thiết bị chạy bằng chip Snapdragon vào năm 2024.)

Sự khác biệt giữa mô hình AI mới Llama 2 và mô hình tiền nhiệm Llama.

Theo sách trắng (whitepaper) được Meta công bố, Llama 2 có hai phiên bản là Llama 2 và Llama 2-Chat, trong đó Llama 2-Chat được tối ưu cho các cuộc trò chuyện hai chiều. Llama 2 và Llama 2-Chat cũng được chia nhỏ thành các phiên bản có độ phức tạp khác nhau gồm 7 tỷ tham số, 13 tỷ tham số và 70 tỷ tham số.

(“Tham số” được Meta định nghĩa là các phần của mô hình được học từ dữ liệu được sử dụng để huấn luyện. Tham số cũng được sử dụng để xác định kỹ năng giải quyết vấn đề của mô hình mà trong trường hợp này là tạo văn bản.)

Llama 2 hiện đã được đào tạo trên 2 triệu mã thông báo (tokens), trong đó “mã thông báo” đại diện cho văn bản thô — ví dụ: “fan”, “tas” và “tic” cho từ văn bản “fantastic”, con số này cao gần gấp đôi so với thế hệ Llama cũ. Theo Meta, mô hình AI càng có nhiều mã thông báo, thì càng hoạt động hiệu quả.

So sánh với các mô hình khác trên thị trường, hiện mô hình ngôn ngữ lớn (LLM) hàng đầu của Google là PaLM 2, được báo cáo là đã được đào tạo trên 3.6 triệu mã thông báo hay GPT-4 (được sử dụng trong ChatGPT của OpenAI) cũng được đào tạo trên hàng triệu mã thông báo).

Mặc dù Meta không tiết lộ các nguồn cụ thể của những dữ liệu được sử dụng để đào tạo mô hình, tuy nhiên nhiều chuyên gia trong ngành cho rằng dữ liệu đó chủ yếu là từ hệ thống web mở (Open Web) và bằng tiếng Anh.

Liên quan đến các nguồn dữ liệu mà các mô hình AI sử dụng để đào tạo hệ thống, hiện có rất nhiều tranh cãi xoay quanh việc bảo vệ bản quyền, cho rằng các chatbot AI như ChatGPT đang đánh cắp dữ liệu (sách, báo, nội dung từ trang web…) mà chưa có sự cho phép của các bên sở hữu.

Các thông tin do mô hình AI Llama 2 của Meta cung cấp có chính xác không?

Theo thừa nhận của chính Meta, Llama 2 về cơ bản cũng giống như tất cả các mô hình AI tổng quát khác, tức vẫn có những sai lệch nhất định do sự bất cân bằng và thiếu chính xác của các nội dung đầu vào (dữ liệu được sử dụng để đào tạo AI).

Tuy nhiên, thông qua mối quan hệ đối tác với Microsoft, Llama 2 đang sử dụng Azure AI Content Safety, một tính năng được thiết kế để phát hiện các nội dung “không phù hợp” trên các hình ảnh và văn bản do AI (Artificial intelligence) tạo ra, đây chính là chìa khoá giúp Llama 2 giảm thiểu các nội dung sai lệch và độc hại.

Meta cũng nhấn mạnh trong sách trắng rằng người dùng Llama 2 phải tuân thủ các điều khoản của Meta, trong đó phải chấp nhận các nguyên tắc liên quan đến “sự phát triển an toàn” của Llama 2.

Meta cho biết: “Chúng tôi tin rằng việc chia sẻ công khai các mô hình ngôn ngữ lớn sẽ giúp cho các hệ thống AI tổng quát trở nên an toàn và hữu ích hơn. Chúng tôi mong muốn được xem Llama 2 chính là kết quả của những gì mà thế giới phát triển được.”

Mặc dù vậy, các mô hình mã nguồn mở (open source models) hiện vẫn không thể tránh khỏi các rủi ro nhất định.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Nam Nguyen | MarketingTrips