Alibaba ra mắt Qwen2 (Math): Mô hình AI về toán được cho là vượt trội hơn LLM từ OpenAI và Google

14 Tháng Tám, 2024

Alibaba vừa công bố một bước tiến quan trọng trong lĩnh vực AI với mô hình toán học mới, cho phép giải quyết các bài toán phức tạp một cách hiệu quả hơn. Mô hình này được kỳ vọng sẽ tạo ra những đột phá trong nhiều lĩnh vực, từ nghiên cứu khoa học đến ứng dụng thực tiễn…

Để dẫn đầu trong cuộc đua phát triển trí tuệ nhân tạo, Alibaba đã cho ra mắt Qwen2-Math. Đây là một bộ các mô hình ngôn ngữ lớn được thiết kế đặc biệt để giải quyết các bài toán toán học. Alibaba tự tin cho biết Qwen2-Math có khả năng vượt qua cả GPT-4o của OpenAI, một trong những mô hình AI hàng đầu hiện nay.

Trong một bài đăng trên GitHub, nhóm Qwen thuộc đơn vị điện toán đám mây của Alibaba đã chia sẻ về quá trình nghiên cứu kéo dài một năm để cải thiện khả năng lập luận toán học của các mô hình ngôn ngữ lớn. Nhóm nghiên cứu đã tập trung vào việc nâng cao khả năng giải quyết các bài toán số học của các mô hình này.

THÀNH TÍCH VƯỢT TRỘI CỦA QWEN2 TRONG LĨNH VỰC TOÁN HỌC

Nhóm Qwen chia sẻ trong bài đăng rằng: “Trong năm qua, chúng tôi đã dành nhiều nỗ lực để nghiên cứu và nâng cao khả năng lập luận của các mô hình ngôn ngữ lớn (LLM), đặc biệt tập trung vào khả năng giải quyết các bài toán số học”.

Alibaba đã phát hành Qwen2 vào tháng 6, một hệ thống gồm nhiều mô hình AI khác nhau. Những mô hình này được thiết kế để tạo ra các văn bản giống như con người. Mỗi mô hình trong Qwen2 có một số lượng tham số khác nhau.

Tham số ở đây giống như những nút điều chỉnh nhỏ, giúp chúng ta tùy chỉnh cách mô hình hoạt động để đạt được kết quả mong muốn. Nhờ vào các tham số này, các mô hình AI có thể thực hiện nhiều tác vụ phức tạp, từ viết văn, dịch thuật cho đến trả lời các câu hỏi phức tạp.

Theo nhóm Qwen, mô hình Qwen2-Math-72B-Instruct, với số lượng tham số lớn nhất, đã xuất sắc vượt qua các đối thủ cạnh tranh đến từ các công ty công nghệ hàng đầu Hoa Kỳ như OpenAI (GPT-4o), Anthropic (Claude 3.5 Sonnet), Google (Gemini 1.5 Pro) và Meta (Llama-3.1-405B) trong các bài kiểm tra toán học.

Mặc dù nhóm Qwen bày tỏ hy vọng rằng Qwen2-Math sẽ trở thành công cụ hữu ích để giải quyết các bài toán phức tạp, họ cũng thừa nhận rằng mô hình hiện tại chỉ hỗ trợ tiếng Anh. Tuy nhiên, nhóm đang tích cực phát triển các phiên bản song ngữ và đa ngôn ngữ để mở rộng phạm vi ứng dụng của mô hình trong tương lai.

Thành tích dẫn đầu bảng xếp hạng 10 mô hình nguồn mở hàng đầu thế giới của Qwen-72B-Instruct LLM đã càng khẳng định vị thế hàng đầu của Alibaba trong lĩnh vực trí tuệ nhân tạo. Những mô hình toán học tiên tiến này không chỉ góp phần nâng cao uy tín của công ty mà còn chứng tỏ sự phát triển vượt bậc của AI tại Trung Quốc.

TIỀM NĂNG CỦA CÁC MÔ HÌNH NGÔN NGỮ LỚN TRUNG QUỐC

Với việc mở cửa mã nguồn Tongyi Qianwen trong hơn một năm, Alibaba đã tạo ra một cộng đồng phát triển sôi động. Các nhà phát triển trên toàn thế giới có thể tự do truy cập, sửa đổi và chia sẻ mã nguồn, từ đó tạo ra những ứng dụng và dịch vụ mới dựa trên nền tảng này. Điều này không chỉ thúc đẩy sự phát triển của AI mà còn góp phần xây dựng một hệ sinh thái công nghệ mở.

Trong bảng xếp hạng LLM của SuperClue vào tháng 7, Qwen2-72B-Instruct đã thể hiện khả năng vượt trội, chỉ xếp sau hai mô hình hàng đầu là GPT-4o và Claude 3.5 Sonnet. Điều này chứng tỏ mô hình này có khả năng tính toán, suy luận logic, mã hóa và hiểu văn bản rất tốt.

Theo đánh giá của SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Mỹ đang dần thu hẹp lại. Kết quả này cho thấy nỗ lực không ngừng của các nhà nghiên cứu Trung Quốc trong việc phát triển các LLM có khả năng cạnh tranh trên trường quốc tế.

Năm mô hình của Trung Quốc, bao gồm Alibaba, công ty khởi nghiệp Deepseek, SenseTime niêm yết tại Hồng Kông, nhà cung cấp điện thoại thông minh Oppo và nỗ lực hợp tác giữa Đại học Thanh Hoa và công ty khởi nghiệp Zhipu AI, đã vượt trội hơn GPT-4 Turbo – một trong những mô hình tốt nhất từ OpenAI do Microsoft hậu thuẫn, theo SuperClue.

Một bài kiểm tra riêng được công bố vào tháng 7 bởi LMSYS – một tổ chức nghiên cứu mô hình AI được hỗ trợ bởi Đại học California, Berkeley – cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

Special Offer từ MarketingTrips:

Tham khảo giải pháp Agency Listing từ MarketingTrips: Agency Networks
Đăng bài không giới hạn trên MarketingTrips vớfi chi phí chỉ bằng 1 bài đăng (Booking): Content Partner
Đăng ký (dành cho Agency): Sign up

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin tức trực tuyến về Marketing, Digital Marketing, Thương hiệu, Quảng cáo và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Theo VnEconomy

Alibaba ra mắt Qwen2 (Math): Mô hình AI về toán được cho là vượt trội hơn LLM từ OpenAI và Google

THÀNH TÍCH VƯỢT TRỘI CỦA QWEN2 TRONG LĨNH VỰC TOÁN HỌC

TIỀM NĂNG CỦA CÁC MÔ HÌNH NGÔN NGỮ LỚN TRUNG QUỐC

Bài viết liên quan

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

ZORA ra mắt “thị trường theo dõi” ATTENTION MARKETS để dự đoán xu hướng internet

OpenAI: Mô hình thu phí cố định của ChatGPT sắp thay đổi

Bitcoin đang chạy theo hướng tách khỏi thị trường truyền thống

Nghiên cứu: Quảng cáo TikTok thúc đẩy tích cực doanh thu phòng vé

OpenAI vừa cho ra mắt mô hình GPT-5.4 (GPT-5.4 Thinking) với khả năng suy luận nhanh

Báo cáo The Connected Consumer: Các nền tảng AI được sử dụng phổ biến nhất tại Việt Nam

Meta kiện một tài khoản quảng cáo ở Việt Nam vì sử dụng chiêu trò qua mặt trình xét duyệt quảng cáo

AI-EO có thể sẽ là tương lai của SEO

Startup AI Anthropic vừa huy động 30 tỷ USD trong vòng gọi vốn mới nhất

Google: Người tiêu dùng bắt đầu tìm kiếm thông tin về Tết 2026 từ sớm để tối ưu hóa lịch trình

Gemini AI của Google có hơn 750 triệu người dùng hoạt động hàng tháng (MAU)

Nổi bật

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

Alibaba sa thải tới hơn 60.000 nhân viên trong 1 năm (nhằm dồn lực cho AI)

Nghiên cứu: Mức độ hạnh phúc của giới trẻ giảm mạnh vì mạng xã hội

YouTube đang ngày càng làm khó người dùng muốn xem YouTube miễn phí

Quy mô thị trường Trà và Cà Phê hiện đại của các nước trong khu vực Đông Nam Á năm 2025

ZORA ra mắt “thị trường theo dõi” ATTENTION MARKETS để dự đoán xu hướng internet

OpenAI: Mô hình thu phí cố định của ChatGPT sắp thay đổi

Thị trường chuỗi đồ uống ở Việt Nam có quy mô hơn 1.3 tỷ USD tính đến 2025

Mới nhất

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

Alibaba sa thải tới hơn 60.000 nhân viên trong 1 năm (nhằm dồn lực cho AI)

Nghiên cứu: Mức độ hạnh phúc của giới trẻ giảm mạnh vì mạng xã hội

YouTube đang ngày càng làm khó người dùng muốn xem YouTube miễn phí

Quy mô thị trường Trà và Cà Phê hiện đại của các nước trong khu vực Đông Nam Á năm 2025

Đọc nhiều

Báo cáo thị trường thương mại điện tử Việt Nam năm 2025 – 2026

Social Media Marketing Benchmarks 2026: Tiêu chuẩn đánh giá hiệu quả Marketing cho Marketers

X là gì? Hướng dẫn sử dụng mạng xã hội X cho người mới

Thuật toán của Instagram và Reels (cập nhật 2026)

Hướng dẫn sử dụng Tether (USDT) tại Việt Nam