SeamlessM4T: Meta công bố AI mới có thể dịch hơn 100 ngôn ngữ

24 Tháng Tám, 2023

Công ty mẹ của Facebook, Meta Platforms vừa ra mắt mô hình AI-SeamlessM4T. Nó có thể hỗ trợ dịch các văn bản viết và văn bản nói ra gần 100 ngôn ngữ. Đây là sự kết hợp công nghệ mà trước đây chỉ có trong các mô hình riêng biệt.

SeamlessM4T: Meta công bố AI mới có thể dịch hơn 100 ngôn ngữ

Theo giới thiệu từ chính CEO Mark Zuckerberg, SeamlessM4T còn có thể phiên dịch toàn bộ “lời nói sang lời nói” với 35 ngôn ngữ.

CEO này còn cho biết những công cụ như vậy tạo điều kiện thuận lợi cho sự tương tác giữa người dùng trên toàn cầu trong vũ trụ ảo (Metaverse), một tập hợp các thế giới ảo được kết nối với nhau mà ông đang đặt cược tương lai của công ty vào đó.

Ngoài SeamlessM4T, Meta cũng đã phát hành một loạt các mô hình AI mà hầu hết miễn phí trong năm nay, bao gồm mô hình ngôn ngữ đàm thoại lớn Llama 2. Điều này đặt ra thách thức nghiêm trọng đối với các mô hình độc quyền được bán bởi OpenAI do Microsoft hậu thuẫn và Google của Alphabet.

SeamlessM4T được xây dựng dựa trên một dự án trí tuệ nhân tạo (AI) trước đây của Meta. Vào tháng 7.2022, công ty đã triển khai dự án “Không ngôn ngữ nào bị bỏ lại phía sau”, sử dụng AI để dịch văn bản thành văn bản cho 200 ngôn ngữ với trọng tâm là cải thiện bản dịch cho các ngôn ngữ hiếm hơn hoặc ít được sử dụng hơn, theo CNET.

Giống như nhiều công ty công nghệ lớn, Meta đã tăng cường tập trung vào việc phát triển và ra mắt các công cụ và dịch vụ hỗ trợ AI trong năm nay.

Như Microsoft ra mắt tính năng tìm kiếm Bing mới được tích hợp AI vào tháng 2, sử dụng cùng công nghệ hỗ trợ ChatGPT của OpenAI.

CEO Zuckerberg cho biết hệ sinh thái AI mở mang lại lợi ích cho Meta vì công ty có thể huy động nguồn lực từ cộng đồng một cách hiệu quả để tạo ra các công cụ hướng tới người tiêu dùng, tương tác và phục vụ người tiêu dùng, cho nền tảng xã hội của mình hơn là tính phí truy cập vào các mô hình, theo Reuters.

Tuy nhiên, Meta phải đối mặt với các câu hỏi pháp lý xung quanh vấn đề về dữ liệu đào tạo (dữ liệu ban đầu mà họ cần để tạo ra các mô hình AI).

Vào tháng 7, diễn viên hài Sarah Silverman và hai tác giả khác đã đệ đơn kiện Meta và OpenAI vì vi phạm bản quyền, cáo buộc hai công ty này sử dụng sách của họ làm dữ liệu đào tạo mà không có sự cho phép của tác giả, theo Reuters.

Đối với mô hình SeamlessM4T, các nhà nghiên cứu của Meta cho biết họ đã thu thập dữ liệu đào tạo âm thanh từ 4 triệu giờ “âm thanh thô của kho lưu trữ dữ liệu web có sẵn công khai “. Họ không nói rõ là kho lưu trữ nào.

Người phát ngôn của Meta không trả lời các câu hỏi về nguồn gốc của dữ liệu âm thanh. Dữ liệu văn bản đến từ các bộ dữ liệu được tạo ra vào năm ngoái, lấy nội dung từ Wikipedia và các trang web liên kết, theo tài liệu nghiên cứu.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Nam Nguyen | MarketingTrips

SeamlessM4T: Meta công bố AI mới có thể dịch hơn 100 ngôn ngữ

Bài viết liên quan

Amazon công bố khoản đầu tư hơn 10 tỷ USD vào Ấn Độ

Công ty sở hữu Claude AI đang chuẩn bị cho IPO với định giá gần 1000 tỷ USD

Sáu năm giữa bão crypto: Giải phẫu hành trình một sàn giao dịch từ startup đến hệ sinh thái đa tài sản

Google Chrome âm thầm tải xuống 4 GB dữ liệu mô hình AI trực tiếp về máy tính

Google vừa công bố tích hợp AI vào trình duyệt Chrome giúp tóm tắt nội dung và gửi email

Gmail cho phép thay đổi địa chỉ email (thay vì phải lập tài khoản mới)

Lý do OpenAI đóng cửa ứng dụng tạo video Sora từng gây sốt khi mới ra mắt

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

ZORA ra mắt “thị trường theo dõi” ATTENTION MARKETS để dự đoán xu hướng internet

OpenAI: Mô hình thu phí cố định của ChatGPT sắp thay đổi

Bitcoin đang chạy theo hướng tách khỏi thị trường truyền thống

Nghiên cứu: Quảng cáo TikTok thúc đẩy tích cực doanh thu phòng vé

Nổi bật

Top 10 thương hiệu giá trị nhất Việt Nam năm 2026 (tổng giá trị gần 25 tỷ USD)

Google bị châu Âu phạt gần 1 tỷ USD vì hành vi thiên vị trên Google Play và công cụ tìm kiếm

Ứng dụng nhắn tin (Messenger) của Facebook lại bị lỗi trên toàn cầu

Báo cáo từ Gallup: Người lao động Việt Nam ít stress nhất Đông Nam Á

Thêm một thương hiệu thời trang Việt Nam được nhà đầu tư ngoại rót vốn

Nhà sáng lập DeepSeek trở thành tỷ phú AI giàu nhất thế giới với 36 tỷ USD

Mô hình kinh doanh tỷ USD đứng sau đế chế gọi xe Grab

Every Half Coffee Roasters (Every Half) vừa công bố hoàn tất vòng gọi vốn Series A trị giá 8 triệu USD

Mới nhất

Top 10 thương hiệu giá trị nhất Việt Nam năm 2026 (tổng giá trị gần 25 tỷ USD)

Google bị châu Âu phạt gần 1 tỷ USD vì hành vi thiên vị trên Google Play và công cụ tìm kiếm

Ứng dụng nhắn tin (Messenger) của Facebook lại bị lỗi trên toàn cầu

Báo cáo từ Gallup: Người lao động Việt Nam ít stress nhất Đông Nam Á

Thêm một thương hiệu thời trang Việt Nam được nhà đầu tư ngoại rót vốn

Đọc nhiều

X là gì? Hướng dẫn sử dụng mạng xã hội X cho người mới

Shopee và Meta vừa chính thức công bố triển khai chương trình Tiếp thị liên kết (Affiliate Marketing) trên Instagram tại Việt Nam

Báo cáo thị trường thương mại điện tử Việt Nam năm 2025 – 2026

Social Media Marketing Benchmarks 2026: Tiêu chuẩn đánh giá hiệu quả Marketing cho Marketers

Các doanh nghiệp cần làm gì trong thời điểm vàng của thương mại điện tử