Skip to main content

Nghiên cứu: Các mô hình AI như GPT-4 của ChatGPT tự do sử dụng các nội dung có bản quyền

7 Tháng Ba, 2024

Các nghiên cứu thử nghiệm mới đây cho thấy các mô hình AI hàng đầu hiện nay như GPT-4 có trong ChatGPT của OpenAI không thể phân biệt và loại trừ các nội dung có bản quyền (copyright).

Nghiên cứu: Các mô hình AI như GPT-4 của ChatGPT không thể phân biệt nội dung bản quyền
Nghiên cứu: Các mô hình AI như GPT-4 của ChatGPT không thể phân biệt nội dung bản quyền

Patronus AI, một công ty chuyên đánh giá các mô hình AI được thành lập bởi các cựu nhà nghiên cứu của Meta, mới đây đã công bố nghiên cứu cho thấy rằng các mô hình AI hàng đầu hiện nay vẫn liên tục tạo ra các nội dung có bản quyền, các chatbot AI như ChatGPT “không thể phân biệt và loại trừ các nội dung đã được đăng ký bản quyền trước đó.”

Công ty này đã thử nghiệm công nghệ GPT-4 có trong ChatGPT của OpenAI, Claude 2 của Anthropic, Llama 2 của Meta và Mixtral của Mistral AI, yêu cầu các chatbot AI tạo ra những nội dung từ những cuốn sách đã được bảo vệ bởi luật bản quyền ở Mỹ.

Sau thử nghiệm, GPT-4 của OpenAI là chatbot tạo ra lượng nội dung có bản quyền cao nhất.

Advertisement

Rebecca Qian, đồng sáng lập và CTO của Patronus AI, người trước đây từng làm việc về nghiên cứu AI có trách nhiệm tại Meta, cho biết (với CNBC) trong một báo cáo: “Chúng tôi đã tìm thấy khá nhiều nội dung có bản quyền trên mọi mô hình mà chúng tôi đã đánh giá, cho dù đó là nguồn mở hay nguồn đóng”.

Chuyên gia này nói thêm: “Có lẽ điều đáng ngạc nhiên nhất là chúng tôi phát hiện ra rằng GPT-4 của OpenAI, mô hình được cho là tốt nhất hiện nay, đã tạo ra lượng nội dung có bản quyền trên 44% lời nhắc (prompts) mà chúng tôi đã yêu cầu. ”

Về tổng thể, nghiên cứu cho thấy GPT-4 được sử dụng bởi ChatGPT của OpenAI hoạt động kém nhất trong việc sản xuất lại những nội dung có bản quyền, dường như “ít có trách nhiệm” hơn so với các mô hình AI khác được thử nghiệm.

Claude 2 của Anthropic có vẻ khó bị lừa hơn vì nó chỉ phản hồi bằng cách sử dụng các nội dung có bản quyền trong 16% số lần được yêu cầu.

Advertisement

Patronus AI viết trong kết quả kiểm tra: “Đối với tất cả các lời nhắc của chúng tôi, Claude từ chối trả lời bằng cách nói rằng nó là trợ lý AI và không có quyền truy cập vào những nội dung có bản quyền”.

Mô hình Mixtral của Mistral hoàn thành đoạn đầu tiên của cuốn sách có bản quyền với tỷ lệ 38% thời gian. Mặt khác, Llama 2 của Meta đã phản hồi bằng nội dung có bản quyền trên 10% lời nhắc.

Anand Kannappan, đồng sáng lập và Giám đốc điều hành của Patronus AI, chia sẻ: “Nói chung, thực tế là tất cả các mô hình ngôn ngữ lớn đều đang tạo ra nguyên văn những nội dung có bản quyền, điều này thực sự làm chúng tôi bất ngờ”.

Nghiên cứu này được đưa ra trong bối cảnh OpenAI và các nhà xuất bản không ngừng đấu tranh về việc các chatbot AI “tự do” sử dụng các nội dung có bản quyền để đào tạo các mô hình AI.

Advertisement

Trước đây, OpenAI cũng từng nói rằng “không thể” đào tạo nên các mô hình AI hàng đầu nếu không có các nội dung có bản quyền.

OpenAI viết trong một báo cáo rằng: “Bởi vì các nội dung có bản quyền ngày nay bao trùm hầu như mọi loại biểu hiện của con người – bao gồm các bài đăng trên blog, ảnh, bài đăng trên diễn đàn, đoạn mã phần mềm và tài liệu của chính phủ – nên sẽ không thể đào tạo các mô hình AI nếu không sử dụng các tài liệu có bản quyền”.

Special Offer từ MarketingTrips:

  • Tham khảo giải pháp Agency Listing từ MarketingTrips: Agency Networks
  • Đăng bài không giới hạn trên MarketingTrips với chi phí chỉ bằng 1 bài đăng (Booking): Content Partner
  • Đăng ký (dành cho Agency): Sign up

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin tức trực tuyến về Marketing, Digital Marketing, Thương hiệu, Quảng cáo và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Advertisement

Bài viết liên quan

Nổi bật

Advertisement