Skip to main content

Thẻ: phogpt

VinAI: PhoGPT có thể làm thơ, viết email xin việc ngay cả khi mất kết nối internet

Sáng 6/12, VinAI (thuộc Tập đoàn Vingroup) đã trình làng ứng dụng PhoGPT (Phở GPT) – phiên bản chatbot trí tuệ nhân tạo chuyên dụng cho tiếng Việt.

Tại Ngày Trí tuệ nhân tạo (AI Day 2023), VinAI đã cho ra mắt nền tảng chatbot tiếng Việt có tên gọi là Phở GPT (PhoGPT). Chia sẻ về ý tưởng tạo ra chatbot này, đại diện VinAI cho biết sự ra đời của Phở GPT bắt nguồn từ những hạn chế của các mô hình ngôn ngữ lớn (LLMs) bằng tiếng Việt đã có.

Các thử nghiệm thực tế đã chứng minh rằng những mô hình này chưa đạt được hiệu suất tối ưu, gây khó khăn trong việc ứng dụng cho các mục đích thực tế.

Bên cạnh đó, việc thiếu một bộ mã nguồn mở, như một nền tảng cho mô hình ngôn ngữ tiếng Việt của người Việt, do người Việt làm chủ, làm giảm khả năng sáng tạo, cũng như những nghi ngại về tính bảo mật khi phải sử dụng phần mềm của nhà cung cấp.

Tiến sĩ Bùi Hải Hưng, CEO VinAI cho biết không phải khi AI tổng quát (Generative AI) trở nên nổi tiếng thông qua ChatGPT của OpenAI thì công ty mới bắt đầu nghiên cứu.

“Chúng tôi đã nghiên cứu AI tổng quát từ nhiều năm trước. VinAI bắt đầu là một công ty non trẻ và đội ngũ của chúng tôi đã tăng lên, từ sản phẩm cho tới nhóm nghiên cứu. Hiện tai, VinAI thuộc top 20 công ty nghiên cứu AI hàng đầu thế giới”, ông Hưng chia sẻ.

Trong buổi ra mắt Phở GPT, tiến sĩ Bùi Hải Hưng và các cộng sự đã trình diễn tính năng của Phở GPT, từ việc tạo hình ảnh thông qua câu lệnh cho tới thực hiện yêu cầu làm thơ, viết email hay đánh giá một hiện tượng nào đó…

Kết quả cho thấy chatbot của VinAI thực hiện khá ấn tượng và không thua kém các chatbot hiện hành trên thế giới hiện nay và tất cả đều được giao tiếp bằng tiếng Việt.

Phở GPT làm tốt hơn ChatGPT của OpenAI nhờ khả năng thực hiện câu lệnh khi đang ở chế độ máy bay trên điện thoại. Trong khi ChatGPT không thể phản hồi do mất kết nối internet thì Phở GPT vẫn có thể thực hiện các yêu cầu từ đội ngũ VinAI.

Theo giới thiệu, Phở GPT là mô hình ngôn ngữ dữ liệu lớn có 7.5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có (như cơ chế tập trung chớp nhoáng (Flash Attention), ngoại suy độ dài ngữ cảnh AliBi).

Những kỹ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên của Phở GPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.

Phở GPT được giới thiệu là một dự án mã nguồn mở (Open-source), thay vì là một phần mềm sở hữu riêng như ChatGPT của OpenAI. Việc công khai mã nguồn Phở GPT và sẵn sàng cung cấp cho người, giúp tạo ra một môi trường, cộng đồng người dùng có thể phát triển các ứng dụng tùy chỉnh, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc vào nguồn từ các phần mềm sở hữu riêng.

Trong thời gian tới, VinAI sẽ có kế hoạch nghiên cứu và phát triển ứng dụng dành cho người dùng cá nhân và các gói giải pháp hỗ trợ chuyên sâu dành cho doanh nghiệp bằng ngôn ngữ tiếng Việt trong các lĩnh vực như y tế, giáo dục…

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin tức trực tuyến về Marketing, Thương hiệu và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

 

Theo Doanh Nghiệp & Kinh Doanh

CEO VinAI: Đội ngũ Việt Nam đủ sức làm các mô hình tương tự ChatGPT

“Việt Nam thuộc top đầu Đông Nam Á về mức độ tiếp nhận trí tuệ nhân tạo, thậm chí là dẫn đầu Đông Nam Á”, đây là nhận định của Tiến sĩ Bùi Hải Hưng, CEO VinAI bên lề sự kiện Ngày Trí tuệ nhân tạo 2023 (AI Day 2023) diễn ra tại TP HCM hôm 5/12.

CEO VinAI: Đội ngũ Việt Nam đủ sức làm mô hình tương tự ChatGPT
CEO VinAI: Đội ngũ Việt Nam đủ sức làm mô hình tương tự ChatGPT

Lần thứ 5 tổ chức, AI Day 2023 tập trung thảo luận về chủ đề AI Tạo sinh – GenAI.

Tại sự kiện lần này, VinAI ra mắt dự án AI Việt Nam có tên gọi là “PhoGPT” vào ngày 6/12. Theo ông Hưng, sự ra mắt của bộ mã nguồn mở cho mô hình ngôn ngữ lớn của VinAI là lần đầu tiên ở Đông Nam Á. Do đó, CEO VinAI hoàn toàn tự tin vào trình độ của các kỹ sư Việt Nam.

“Trên thế giới, số lượng nhân sự đủ hiểu và làm được công nghệ lõi về AI thì không có nhiều, nhưng tôi cũng rất tự hào khi lần đầu tiên, thế giới ra mắt một công nghệ như ChatGPT và đội ngũ của chúng ta có thể hiểu, đủ sức làm ra mô hình tương tự, như vậy mức độ tiếp nhận của Việt Nam rất là nhanh”, Tiến sĩ Bùi Hải Hưng cho biết dự án này được VinAI phát triển từ đầu, không phải là điều chỉnh dựa trên một mô hình sẵn có.

“PhởGPT” là dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt. Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hoá người Việt. Theo giới thiệu, PhởGPT có khả năng hiểu và viết văn phong tiếng Việt. Nguồn dữ liệu huấn luyện cho mô hình đều khả dụng trên internet.

Tiến sĩ Bùi Hải Hưng cho biết mô hình ngôn ngữ này được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

Trong tương lai, công ty sẽ tập trung tối ưu hoá những mô hình tương tự PhởGPT để tạo ra độ chính xác, nhỏ gọn và hiệu quả hơn. Từ đó, giúp giảm thiểu chi phí sản xuất mô hình trí tuệ nhân tạo.

Tuy vậy, đây là hành trình dài hơi và cũng là vấn đề chung của cộng đồng toàn cầu, do đó ông Hưng không có đặt ra thời hạn cụ thể cho mục tiêu này.

Phía VinAI cho biết khi so sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác, kết quả cho thấy PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá.

Đội ngũ phát triển PhởGPT đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.

Theo ông Hưng, điểm đặc biệt nhất của PhởGPT là một mã nguồn mở, điều này mở ra cơ hội cho nhiều đơn vị khác có thể khai thác và tạo ra những phiên bản AI chuyên dụng cho người Việt.

“Chúng tôi hy vọng sẽ tận dụng nguồn lực của cộng đồng để tạo ra nhiều ứng dụng phục vụ người Việt, một mình VinAI thực sự không thể đảm đương được hết”, CEO VinAI chia sẻ.

PhởGPT là một dự án mã nguồn mở (Open-source) thay vì là một phần mềm sở hữu riêng như ChatGPT của OpenAI. Điều này nghĩa là mã nguồn của PhởGPT là công khai và có sẵn cho cộng đồng người phát triển.

Bằng cách sử dụng mô hình mã nguồn mở PhởGPT, người dùng có thể phát triển các ứng dụng tùy chỉnh, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phải phụ thuộc vào API từ các phần mềm sở hữu riêng.

PhởGPT được giới thiệu là một mô hình ngôn ngữ với dữ liệu lớn có 7.5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có như cơ chế tập trung chớp nhoáng (Flash Attention) và ngoại suy độ dài ngữ cảnh AliBi.

Những kỹ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.

Chia sẻ tại sự kiện, ông Trần Duy Đông – Thứ trưởng Bộ Kế hoạch và đầu tư nhấn mạnh: “AI sẽ là một trong những lĩnh vực mà Việt Nam có nhiều tiềm năng để phát triển mạnh mẽ và sớm bắt kịp với trình độ của thế giới.

Bộ sẽ luôn ủng hộ và đồng hành cùng cộng đồng AI nói riêng và cộng đồng khoa học công nghệ nói chung để phát triển một hệ sinh thái đổi mới sáng tạo toàn diện, năng động, đóng góp cho sự phát triển chung của đất nước”.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Theo Doanh Nghiệp & Kinh Doanh

PhoGPT: Chatbot AI mới công bố của VinAI thuộc Vingroup

VinAI Research, Viện nghiên cứu trí tuệ nhân tạo (AI) thuộc Vingroup vừa công bố ra mắt dự án chatbot AI có tên là PhoGPT dành cho người Việt.

PhoGPT
PhoGPT: Chatbot AI mới công bố của VinAI thuộc Vingroup

Theo đó, VinAI Research, Viện nghiên cứu trí tuệ nhân tạo (AI) thuộc Vingroup vừa công bố ra mắt dự án chatbot AI có tên là PhoGPT dành cho người Việt.

PhoGPT là gì?

Theo giới thiệu từ TechinAsia, PhoGPT là mô hình dựa trên công nghệ chuyển đổi được đào tạo trước (GPT: Generative Pre-trained Transformer), kết hợp Triton và ALiBi để ngoại suy độ dài ngữ cảnh được phát triển bởi VinAI thuộc Vingroup (Tập đoàn Vingroup).

(GPT chính là công nghệ được sử dụng trong các chatbot AI như ChatGPT).

Bằng cách sử dụng thư viện llm-foundry của Mosaicml llm, VinAI đào tạo trước PhoGPT từ đầu trên kho văn bản tiếng Việt đào tạo trước 41GB. Kho dữ liệu đào tạo trước này bao gồm 1GB văn bản Wikipedia và một biến thể 40GB được loại bỏ trùng lặp của tập dữ liệu tin tức (phiên bản 21/05/2021).

Các nhà nghiên cứu VinAI tinh chỉnh PhoGPT sử dụng bộ dữ liệu bao gồm 150K cặp câu lệnh và phản hồi bằng tiếng Việt. Bộ dữ liệu này được xây dựng bằng cách ghép các nguồn sau:

(i) 67K cặp từ tập con tiếng Việt của Bactrian-X ;

(ii) 40K cặp ShareGPT không có mã và toán, dịch từ tiếng Anh sang tiếng Việt bằng VinAI Translate;

(iii) 40K lời nhắc bao gồm nhận thức về sự căm ghét, xúc phạm, độc hại và an toàn, phần lớn bao gồm cả những lời nhắc được dịch sang tiếng Việt; và

(iv) 1000 cặp để trả lời câu hỏi dựa trên ngữ cảnh, 500 để viết thơ, 500 cho viết luận, 500 cho sửa lỗi chính tả và 500 cho tóm tắt từng tài liệu.

Theo công bố, PhoGPT chỉ thua ChatGPT trong hầu hết các trường hợp, còn lại cao hơn các LLMA khác.

Tuy nhiên, nhà phát triển cho biết PhoGPT có những hạn chế nhất định. Ví dụ, nó không giỏi trong các nhiệm vụ liên quan đến lý luận, mã hóa hoặc toán học.

PhoGPT đôi khi có thể tạo ra lời nói có hại, căm thù, phản hồi thiên vị hoặc trả lời các câu hỏi không an toàn. Doanh nghiệp khuyến cáo người dùng nên thận trọng khi tương tác với PhoGPT vì nó có thể tạo ra những kết quả đầu ra không chính xác.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin trực tuyến về Marketing và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer