Instagram đào tạo A.I. để hiểu 1 tỷ hình ảnh được công khai trên nền tảng

Facebook cho biết chương trình “thị giác máy tính” này có biệt danh là SEER. Một mô hình AI vượt trội hơn hẳn những mô hình hiện có trong một bài kiểm tra nhận dạng vật thể.

Trên thực tế, Instagram đã trở thành một trong những cơ sở dữ liệu hình ảnh lớn nhất hành tinh trong thập kỷ qua của Facebook. Nền tảng đang sử dụng kho tàng này để dạy cho máy móc học những gì có trong hình ảnh.

Facebook đã công bố vào hôm 4/3 rằng họ đã xây dựng một chương trình trí tuệ nhân tạo có thể “nhìn thấy” những gì nó đang nhìn. Facebook đã làm điều này bằng cách cung cấp cho chương trình hơn 1 tỷ hình ảnh công khai từ nền tảng Instagram.

Facebook cho biết chương trình “thị giác máy tính” mới này có biệt danh là SEER và vốn vượt trội hơn hẳn các mô hình AI hiện có trong một bài kiểm tra nhận dạng vật thể.

Chương trình đã đạt được “điểm chính xác phân loại” là 84,2% khi thực hiện một bài kiểm tra do ImageNet cung cấp, ImageNet là một cơ sở dữ liệu trực quan được thiết kế để sử dụng trong nghiên cứu phần mềm nhận dạng đối tượng trực quan.

Về cơ bản, ImageNet kiểm tra xem chương trình AI của Facebook có thể xác định chính xác nội dung xuất hiện trong hình ảnh hay không.

Cách tiếp cận mới.

Trong khi nhiều mô hình AI khác được ‘đào tạo’ trên các tập dữ liệu được gắn nhãn cẩn thận, Facebook cho biết SEER đã học cách để xác định các đối tượng trong hình ảnh bằng cách phân tích các hình ảnh Instagram ngẫu nhiên và không gắn nhãn.

Kỹ thuật AI này được gọi là self-supervised learning (tạm dịch là tự giám sát để học hỏi).

Các nhà nghiên cứu của Facebook chia sẻ:

“Tương lai của AI là tạo ra các hệ thống có thể học hỏi trực tiếp từ bất kỳ thông tin nào mà chúng được cung cấp – cho dù đó là văn bản, hình ảnh hay một loại dữ liệu khác.

Chúng không cần dựa vào các bộ dữ liệu được sắp xếp và gắn sẵn nhãn để dạy chúng cách nhận ra các đối tượng trong một bức ảnh, diễn giải một khối văn bản hoặc thực hiện bất kỳ tác vụ nào trong số vô số tác vụ khác mà chúng tôi yêu cầu.

Hiệu suất của SEER chứng tỏ rằng kiểu tự giám sát để học hỏi có thể hoàn thành xuất sắc các nhiệm vụ về thị giác máy tính trong môi trường thực tế.

Đây là một bước đột phá cuối cùng sẽ mở ra con đường cho các mô hình thị giác máy tính linh hoạt, chính xác và thích ứng hơn trong tương lai.”

Mặc dù đây chỉ là một dự án nghiên cứu, nhưng người phát ngôn của Facebook cho biết những ứng dụng tiềm năng trong tương lai sẽ được phát triển dựa trên lý thuyết này.

Những vấn đề về quyền riêng tư?

Nhiều người dùng Instagram có thể ngạc nhiên khi biết rằng hình ảnh của họ đang được sử dụng để đào tạo cho hệ thống AI của Facebook.

Liên quan đến vấn đề này, Bà Priya Goyal, một kỹ sư phần mềm tại Facebook AI Research, trao đổi với CNBC:

“Chúng tôi thông báo cho các chủ tài khoản Instagram trong chính sách dữ liệu của mình rằng chúng tôi chỉ sử dụng thông tin chúng tôi có để hỗ trợ nghiên cứu và đổi mới, bao gồm cả tiến bộ công nghệ như thế này.”

Facebook cho biết họ sẽ mở vài mã nguồn ở một số phần mềm của mình để các nhà nghiên cứu khác có thể thử nghiệm với nó.

Bà Goyal cho biết thêm:

“Mặc dù chúng tôi đang chia sẻ chi tiết nghiên cứu của mình đồng thời tạo một thư viện mã nguồn mở cho phép các nhà nghiên cứu khác sử dụng phương pháp ‘tự giám sát để học hỏi’ để đào tạo các mô hình về hình ảnh, nhưng chúng tôi sẽ không chia sẻ hình ảnh hoặc những chế độ khác của SEER”.

Ở một diễn biến khác, các công ty công nghệ lớn khác như Google và Microsoft cũng đang cố gắng để vượt qua những ranh giới của tầm nhìn máy tính.

Vào mùa hè năm ngoái, Google đã xuất bản mô hình thị giác máy tính có tên gọi SimCLRv2, trong khi OpenAI của Elon Musk cũng xuất bản iGPT 2.

Tham gia Cộng đồng We’re Marketer để thảo luận các chủ đề về Marketing và Business tại: Link

Giang Nguyễn | MarketingTrips 

Theo CNBC