SeamlessM4T: Meta công bố AI mới có thể dịch hơn 100 ngôn ngữ

24 Tháng Tám, 2023

Công ty mẹ của Facebook, Meta Platforms vừa ra mắt mô hình AI-SeamlessM4T. Nó có thể hỗ trợ dịch các văn bản viết và văn bản nói ra gần 100 ngôn ngữ. Đây là sự kết hợp công nghệ mà trước đây chỉ có trong các mô hình riêng biệt.

SeamlessM4T: Meta công bố AI mới có thể dịch hơn 100 ngôn ngữ

Theo giới thiệu từ chính CEO Mark Zuckerberg, SeamlessM4T còn có thể phiên dịch toàn bộ “lời nói sang lời nói” với 35 ngôn ngữ.

CEO này còn cho biết những công cụ như vậy tạo điều kiện thuận lợi cho sự tương tác giữa người dùng trên toàn cầu trong vũ trụ ảo (Metaverse), một tập hợp các thế giới ảo được kết nối với nhau mà ông đang đặt cược tương lai của công ty vào đó.

Ngoài SeamlessM4T, Meta cũng đã phát hành một loạt các mô hình AI mà hầu hết miễn phí trong năm nay, bao gồm mô hình ngôn ngữ đàm thoại lớn Llama 2. Điều này đặt ra thách thức nghiêm trọng đối với các mô hình độc quyền được bán bởi OpenAI do Microsoft hậu thuẫn và Google của Alphabet.

SeamlessM4T được xây dựng dựa trên một dự án trí tuệ nhân tạo (AI) trước đây của Meta. Vào tháng 7.2022, công ty đã triển khai dự án “Không ngôn ngữ nào bị bỏ lại phía sau”, sử dụng AI để dịch văn bản thành văn bản cho 200 ngôn ngữ với trọng tâm là cải thiện bản dịch cho các ngôn ngữ hiếm hơn hoặc ít được sử dụng hơn, theo CNET.

Giống như nhiều công ty công nghệ lớn, Meta đã tăng cường tập trung vào việc phát triển và ra mắt các công cụ và dịch vụ hỗ trợ AI trong năm nay.

Như Microsoft ra mắt tính năng tìm kiếm Bing mới được tích hợp AI vào tháng 2, sử dụng cùng công nghệ hỗ trợ ChatGPT của OpenAI.

CEO Zuckerberg cho biết hệ sinh thái AI mở mang lại lợi ích cho Meta vì công ty có thể huy động nguồn lực từ cộng đồng một cách hiệu quả để tạo ra các công cụ hướng tới người tiêu dùng, tương tác và phục vụ người tiêu dùng, cho nền tảng xã hội của mình hơn là tính phí truy cập vào các mô hình, theo Reuters.

Tuy nhiên, Meta phải đối mặt với các câu hỏi pháp lý xung quanh vấn đề về dữ liệu đào tạo (dữ liệu ban đầu mà họ cần để tạo ra các mô hình AI).

Vào tháng 7, diễn viên hài Sarah Silverman và hai tác giả khác đã đệ đơn kiện Meta và OpenAI vì vi phạm bản quyền, cáo buộc hai công ty này sử dụng sách của họ làm dữ liệu đào tạo mà không có sự cho phép của tác giả, theo Reuters.

Đối với mô hình SeamlessM4T, các nhà nghiên cứu của Meta cho biết họ đã thu thập dữ liệu đào tạo âm thanh từ 4 triệu giờ “âm thanh thô của kho lưu trữ dữ liệu web có sẵn công khai “. Họ không nói rõ là kho lưu trữ nào.

Người phát ngôn của Meta không trả lời các câu hỏi về nguồn gốc của dữ liệu âm thanh. Dữ liệu văn bản đến từ các bộ dữ liệu được tạo ra vào năm ngoái, lấy nội dung từ Wikipedia và các trang web liên kết, theo tài liệu nghiên cứu.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Nam Nguyen | MarketingTrips

SeamlessM4T: Meta công bố AI mới có thể dịch hơn 100 ngôn ngữ

Bài viết liên quan

Sáu năm giữa bão crypto: Giải phẫu hành trình một sàn giao dịch từ startup đến hệ sinh thái đa tài sản

Google Chrome âm thầm tải xuống 4 GB dữ liệu mô hình AI trực tiếp về máy tính

Google vừa công bố tích hợp AI vào trình duyệt Chrome giúp tóm tắt nội dung và gửi email

Gmail cho phép thay đổi địa chỉ email (thay vì phải lập tài khoản mới)

Lý do OpenAI đóng cửa ứng dụng tạo video Sora từng gây sốt khi mới ra mắt

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

ZORA ra mắt “thị trường theo dõi” ATTENTION MARKETS để dự đoán xu hướng internet

OpenAI: Mô hình thu phí cố định của ChatGPT sắp thay đổi

Bitcoin đang chạy theo hướng tách khỏi thị trường truyền thống

Nghiên cứu: Quảng cáo TikTok thúc đẩy tích cực doanh thu phòng vé

OpenAI vừa cho ra mắt mô hình GPT-5.4 (GPT-5.4 Thinking) với khả năng suy luận nhanh

Báo cáo The Connected Consumer: Các nền tảng AI được sử dụng phổ biến nhất tại Việt Nam

Nổi bật

Báo cáo thị trường thương mại điện tử Việt Nam năm 2025 – 2026

Shopee tăng phí người bán gấp đôi sau 3 năm

WinMart và Bách Hoá Xanh đang chạy đua để giành thị phần bán lẻ

Startup viết nhạc bằng AI được định giá 2.5 tỷ USD

Chuỗi trà sữa Chagee định vị ở phân khúc trung đến cao cấp khi thâm nhập thị trường Mỹ

Shopee bị phạt 200 triệu đồng vì quảng cáo gây nhầm lẫn cho người dùng

Doanh thu Shopee đạt hơn 5 tỷ USD trong quý 1 năm 2026 (công ty mẹ đạt hơn 7 tỷ USD)

Nhân viên của mạng xã hội Facebook phản đối việc bị theo dõi chuột và bàn phím

Mới nhất

Báo cáo thị trường thương mại điện tử Việt Nam năm 2025 – 2026

Shopee tăng phí người bán gấp đôi sau 3 năm

WinMart và Bách Hoá Xanh đang chạy đua để giành thị phần bán lẻ

Startup viết nhạc bằng AI được định giá 2.5 tỷ USD

Chuỗi trà sữa Chagee định vị ở phân khúc trung đến cao cấp khi thâm nhập thị trường Mỹ

Đọc nhiều

X là gì? Hướng dẫn sử dụng mạng xã hội X cho người mới

Carlsberg Việt Nam bị phạt vì gây nhầm lẫn cho khách hàng về sản phẩm trên bao bì (Huda, Huda Gold và Halida)

Hướng dẫn sử dụng Tether (USDT) tại Việt Nam

Chuỗi trà sữa tại Việt Nam được định giá tới 2 tỷ USD

Báo cáo thị trường thương mại điện tử Việt Nam năm 2025 – 2026