Skip to main content

Thẻ: mô hình ngôn ngữ lớn

Alibaba ra mắt SeaLLMs – mô hình ngôn ngữ lớn dành riêng cho Đông Nam Á

Các mô hình ngôn ngữ lớn LLM dự kiến sẽ hỗ trợ tối ưu cho một số ngôn ngữ địa phương trong khu vực, bao gồm tiếng Việt, Indonesia, Thái Lan, Malay, Khmer, Lào, Tagalog và Miến Điện.

Alibaba ra mắt SEALLM - mô hình ngôn ngữ lớn dành riêng cho Đông Nam Á
Alibaba ra mắt SEALLM – mô hình ngôn ngữ lớn dành riêng cho Đông Nam Á

Tuần trước, Singapore đã công bố kế hoạch phát triển hệ sinh thái mô hình ngôn ngữ lớn (LLM) đầu tiên, phục vụ cho văn hóa và ngôn ngữ đa dạng của khu vực Đông Nam Á. Hiện tại, hầu hết các LLM hiện có đều chỉ sẵn các giá trị và chuẩn mực phục vụ nhiều hơn cho các nước phương Tây.

HỖ TRỢ CÁC NGÔN NGỮ ĐỊA PHƯƠNG CỦA ĐÔNG NAM Á

Giống như tham vọng LLM của Singapore, Học viện Alibaba Damo của Trung Quốc cũng đã tiết lộ SeaLLMs. Alibaba SeaLLMs là một LLM tiên phong đi kèm với 13 tỷ phiên bản tham số và 7 tỷ phiên bản được thiết kế đặc biệt để phục vụ cho các ngôn ngữ đa dạng của Đông Nam Á.

Mặc dù tiếng Anh vẫn được sử dụng rộng rãi trong khu vực, ngôn ngữ bản địa vẫn là một công cụ truyền thông quan trọng của các nước. Ví dụ, ở Malaysia, mặc dù tiếng Anh vẫn được nói chủ yếu, nhưng Malay vẫn là ngôn ngữ được các cơ quan chính phủ sử dụng để truyền thông chính thức, giống như tại các nước Thái Lan, Indonesia, Campuchia, Lào, Việt Nam và Myanmar. Ở Philippines, tiếng Anh là một ngôn ngữ chính, nhưng Tagalog chủ yếu được sử dụng trong giao tiếp.

Các mô hình LLM dự kiến sẽ hỗ trợ tối ưu cho một số ngôn ngữ địa phương trong khu vực, bao gồm tiếng Việt, Indonesia, Thái Lan, Malay, Khmer, Lào, Tagalog và Miến Điện.

Seallm-Chat, mô hình hội thoại, cho thấy khả năng thích ứng với kết cấu văn hóa độc đáo của mỗi thị trường, phù hợp với phong tục, phong cách và khung pháp lý địa phương, làm trợ lý chatbot cho các doanh nghiệp tham gia với các thị trường Đông Nam Á.

SEALLMS là một loạt các mô hình AI không chỉ hiểu các ngôn ngữ địa phương mà còn bao gồm sự phong phú về văn hóa của Đông Nam Á. Sự đổi mới này được thiết lập để đẩy nhanh việc dân chủ hóa AI, trao quyền cho các cộng đồng được thể hiện trong lịch sử trong lĩnh vực kỹ thuật số.

SEALLM HOẠT ĐỘNG NHƯ THẾ NÀO?

Theo một báo cáo của các nhà nghiên cứu Alibaba Damo, các mô hình SEALLM-cơ sở đã trải qua việc đào tạo trước trên một bộ dữ liệu chất lượng cao, đa dạng bao gồm các ngôn ngữ từ khu vực. Điều này là để đảm bảo một sự hiểu biết sắc thái về bối cảnh địa phương và giao tiếp bản địa.

Bộ dữ liệu đào tạo của SeaLLMs được hình thành bởi các tài liệu từ các nguồn công cộng khác nhau, bao gồm các văn bản web, tài liệu tin tức, bài báo học thuật và văn bản có kiến thức chuyên môn. Trước tiên Alibaba sử dụng định danh ngôn ngữ fasttext để lọc các tài liệu không thuộc về ngôn ngữ Đông Nam Á.

Để tiếp tục loại bỏ nội dung có hại hoặc không mong muốn, Alibaba phát triển một đường ống với các mô -đun lọc và lọc dữ liệu khác nhau để xử lý trước dữ liệu được thu thập. Trong khi đó, để duy trì hiệu suất tiếng Anh của SEALLMS, Alibaba cũng giới thiệu một tập hợp các văn bản tiếng Anh chất lượng cao được lấy mẫu từ Redpajama-Data vào đào tạo trước, các nhà nghiên cứu cho biết.

Công việc này đặt nền tảng cho các mô hình trò chuyện như SEALLM-Chat, được hưởng lợi từ các kỹ thuật điều chỉnh tinh chỉnh nâng cao và bộ dữ liệu đa ngôn ngữ được xây dựng tùy chỉnh.

Do đó, các trợ lý chatbot dựa trên các mô hình này không chỉ có thể hiểu mà còn tôn trọng và phản ánh chính xác bối cảnh văn hóa của các ngôn ngữ này trong khu vực, chẳng hạn như các quy tắc xã hội và phong tục, sở thích phong cách và cân nhắc pháp lý.

Một lợi thế kỹ thuật đáng chú ý của Alibaba SeaLLMs là hiệu quả của chúng, đặc biệt là với các ngôn ngữ không phải là Latin. Chúng có thể giải thích và xử lý văn bản dài hơn tới chín lần (hoặc ít hơn các mã thông báo cho cùng một chiều dài của văn bản) so với các mô hình khác như ChatGPT cho các ngôn ngữ không phải là tiếng Latin như Miến Điện, Khmer, LAO và tiếng Thái. Điều đó chuyển thành khả năng thực hiện nhiệm vụ phức tạp hơn, giảm chi phí hoạt động và tính toán và chi phí môi trường thấp hơn.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin tức trực tuyến về Marketing, Digital Marketing, Thương hiệu, Quảng cáo và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Theo VnEconomy

Phân biệt khái niệm mô hình ngôn ngữ lớn (LLMs) và công cụ tìm kiếm (Search Engines)

Trong phạm vi bài viết này, hãy cùng MarketingTrips tìm hiểu các khái niệm cơ bản về mô hình ngôn ngữ lớn (LLMs), sự khác biệt giữa nó với công cụ tìm kiếm (Search Engines), những cơ hội với các mô hình ngôn ngữ lớn như ChatGPT và hơn thế nữa.

Phân biệt khái niệm mô hình ngôn ngữ lớn (LLMs) và công cụ tìm kiếm (Search Engines)
Phân biệt khái niệm mô hình ngôn ngữ lớn (LLMs) và công cụ tìm kiếm (Search Engines)

Trong những tháng trở lại đây, dù bạn là người làm trong lĩnh vực công nghệ hay đơn giản là sử dụng công nghệ để gia tăng năng suất làm việc, các mô hình ngôn ngữ lớn AI (LLM) như ChatGPT hay Google Bard có thể đã không còn quá xa lạ.

Kể từ khi ra đời và trở nên phổ biến, các mô hình như ChatGPT trở thành những công cụ đắc lực hỗ trợ cho việc tìm kiếm thông tin, ý tưởng và nhiều thứ khác, và cũng từ đây, nhiều người cũng tự hỏi vậy các mô hình ngôn ngữ lớn này có gì khác so với công cụ tìm kiếm, nó là công cụ thay thế hay hỗ trợ lẫn nhau.

Dưới đây là tất cả sự khác biệt chính giữa công cụ tìm kiếm và mô hình ngôn ngữ lớn.

Mô hình ngôn ngữ lớn (LLMs) khác với công cụ tìm kiếm (Search Engines) về chức năng.

Các mô hình ngôn ngữ lớn AI được thiết kế để tạo ra các đoạn văn bản (text) giống như cách con người vẫn sử dụng dựa trên thông tin đầu vào mà chúng nhận được. Chúng có thể trả lời các câu hỏi, soạn thảo nội dung, đưa ra đề xuất, hỗ trợ thực hiện nhiệm vụ và hơn thế nữa.

Mặc dù ban đầu, các công cụ như ChatGPT không hỗ trợ tìm kiếm trên web nhưng giờ đây nó có thể duyệt web hay Internet nếu bạn đang sử dụng phiên bản 4 hoặc Plus. Tuy nhiên, một số mô hình ngôn ngữ lớn AI khác lại chủ yếu tập trung tạo ra các phản hồi dựa trên lượng lớn dữ liệu đào tạo mà chúng đã được cung cấp (được đào tạo).

Ngược lại, các công cụ tìm kiếm như Google hay Bing được thiết kế để lập chỉ mục và truy xuất thông tin từ các trang web tồn tại sẵn trên không gian internet thông qua các truy vấn tìm kiếm hay từ khoá.

Bản chất của các công cụ tìm kiếm là liệt kê những thông tin có sẵn công khai thay vì tạo ra thông tin hay nội dung như các mô hình ngôn ngữ lớn.

Trong khi cả mô hình ngôn ngữ lớn và công cụ tìm kiếm đều phục vụ mục đích tìm kiếm thông tin, chúng dường như hỗ trợ lẫn nhau hơn là bài trừ nhau.

Mô hình ngôn ngữ lớn khác với công cụ tìm kiếm về nguồn dữ liệu.

Như đã phân tích ở trên, các mô hình ngôn ngữ lớn được đào tạo trên một tập hợp dữ liệu lớn (Big Data), năng lực của chúng phụ thuộc khá nhiều vào lượng dữ liệu đầu vào này. Ngược lại, các công cụ tìm kiếm sẽ truy xuất trực tiếp các dữ liệu hiện có.

Mặc dù các công cụ tìm kiếm như Google còn có cái gọi là thuật toán xếp hạng, tuy nhiên, dù thuật toán này có như thế nào thì bản chất nó vẫn đang lấy các tập dữ liệu có sẵn (và sau đó xếp hạng chúng).

Mô hình ngôn ngữ lớn khác với công cụ tìm kiếm về cách tương tác.

Một trong những đặc điểm nổi bật của các mô hình ngôn ngữ lớn như ChatGPT đó là khả năng đàm thoại hay trả lời trực tiếp theo hình thức hội thoại giống người, thứ mà công cụ tìm kiếm hiện không thể làm được.

Dựa trên các câu hỏi hay ngữ cảnh mà người dùng nhập vào, các mô hình này sẽ quyết định cách trả lời các nội dung phù hợp và có liên quan nhất.

Mô hình ngôn ngữ lớn khác với công cụ tìm kiếm về dữ liệu đầu ra.

Một điểm khác biệt lớn khác giữa các mô hình ngôn ngữ lớn và công cụ tìm kiếm đó là về dữ liệu đầu ra.

Trong khi các mô hình ngôn ngữ lớn (LLMs) có thể cung cấp chính xác các câu trả lời (bằng văn bản, hình ảnh hoặc video…), các công cụ tìm kiếm lại chỉ liệt kê các website mà chúng cho là có liên quan (dựa trên thuật toán xếp hạng tìm kiếm riêng của từng công cụ tìm kiếm), để có được câu trả lời, người dùng phải nhấp vào các website đã được liệt kê để xem thông tin.

Mặc dù vấn đề mức độ chính xác của các mô hình ngôn ngữ lớn vẫn còn gây tranh cãi, nó vẫn là công cụ cung cấp trực tiếp đáp án hơn là cung cấp các nguồn thông tin liên quan như công cụ tìm kiếm.

Ngoài ra, các phiên bản mới như GPT-4 có trong ChatGPT sẽ được trang bị khả năng cung cấp thông tin theo hướng sáng tạo và nhiều thông tin hơn, hiểu con người nhiều hơn, đây cũng là thứ mà các công cụ tìm kiếm hiện không làm được.

Mô hình ngôn ngữ lớn khác với công cụ tìm kiếm về độ tin cậy và độ chính xác.

Vì đưa ra các câu trả lời trực tiếp, các mô hình ngôn ngữ lớn hiện cũng đối mặt với các tình trạng trả lời sai câu hỏi. Ngược lại, các công cụ tìm kiếm chỉ đơn giản là dẫn nguồn nên cơ bản chuyện đúng sai sẽ nằm ở nguồn cung cấp thông tin (các website, ứng dụng…) hơn là ở chính nó.

Ngoài ra, vì thứ tự và khả năng hiển thị của các nội dung có thể bị ảnh hưởng (lớn) bởi nhiều thuật toán, thủ thuật SEO và các thành kiến tiềm ẩn khác, các nguồn thông tin từ các công cụ tìm kiếm vẫn là một ẩn số về chất lượng nội dung hay cả chuyện đúng sai.

Liệu các mô hình ngôn ngữ lớn như ChatGPT hay Google Bard sẽ lấy đi thị phần của các công cụ tìm kiếm như Google hay Bing?

Ít nhất là đến thời điểm hiện tại, các mô hình ngôn ngữ lớn vẫn chưa có tác động đáng kể đến thị phần của các công cụ tìm kiếm. Google vẫn thống trị thị phần công cụ tìm kiếm toàn cầu, với hơn 90%. Bing đứng ở vị trí thứ hai với khoảng 4%.

Tuy nhiên, khi cuộc cách mạng về trí tuệ nhân tạo (AI) cũng như việc các mô hình ngôn ngữ lớn sẽ tiếp tục phát triển, thị trường các công cụ tìm kiếm trong tương lai cũng được dự báo là sẽ thay đổi rất lớn.

Điều này còn tuỳ thuộc vào mức độ phát triển của chính các mô hình, mức độ chấp nhận của người dùng hay mức độ thay đổi của chính các công cụ tìm kiếm để đáp ứng các nhu cầu mới.

Dự báo hoàn hảo có thể là “tương lai của thế giới tìm kiếm là sự kết hợp giữa các công cụ tìm kiếm truyền thống và các mô hình ngôn ngữ lớn.”

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer