Nghiên cứu: Các mô hình AI như GPT-4 của ChatGPT tự do sử dụng các nội dung có bản quyền

7 Tháng Ba, 2024

Các nghiên cứu thử nghiệm mới đây cho thấy các mô hình AI hàng đầu hiện nay như GPT-4 có trong ChatGPT của OpenAI không thể phân biệt và loại trừ các nội dung có bản quyền (copyright).

Nghiên cứu: Các mô hình AI như GPT-4 của ChatGPT không thể phân biệt nội dung bản quyền

Patronus AI, một công ty chuyên đánh giá các mô hình AI được thành lập bởi các cựu nhà nghiên cứu của Meta, mới đây đã công bố nghiên cứu cho thấy rằng các mô hình AI hàng đầu hiện nay vẫn liên tục tạo ra các nội dung có bản quyền, các chatbot AI như ChatGPT “không thể phân biệt và loại trừ các nội dung đã được đăng ký bản quyền trước đó.”

Công ty này đã thử nghiệm công nghệ GPT-4 có trong ChatGPT của OpenAI, Claude 2 của Anthropic, Llama 2 của Meta và Mixtral của Mistral AI, yêu cầu các chatbot AI tạo ra những nội dung từ những cuốn sách đã được bảo vệ bởi luật bản quyền ở Mỹ.

Sau thử nghiệm, GPT-4 của OpenAI là chatbot tạo ra lượng nội dung có bản quyền cao nhất.

Rebecca Qian, đồng sáng lập và CTO của Patronus AI, người trước đây từng làm việc về nghiên cứu AI có trách nhiệm tại Meta, cho biết (với CNBC) trong một báo cáo: “Chúng tôi đã tìm thấy khá nhiều nội dung có bản quyền trên mọi mô hình mà chúng tôi đã đánh giá, cho dù đó là nguồn mở hay nguồn đóng”.

Chuyên gia này nói thêm: “Có lẽ điều đáng ngạc nhiên nhất là chúng tôi phát hiện ra rằng GPT-4 của OpenAI, mô hình được cho là tốt nhất hiện nay, đã tạo ra lượng nội dung có bản quyền trên 44% lời nhắc (prompts) mà chúng tôi đã yêu cầu. ”

Về tổng thể, nghiên cứu cho thấy GPT-4 được sử dụng bởi ChatGPT của OpenAI hoạt động kém nhất trong việc sản xuất lại những nội dung có bản quyền, dường như “ít có trách nhiệm” hơn so với các mô hình AI khác được thử nghiệm.

Claude 2 của Anthropic có vẻ khó bị lừa hơn vì nó chỉ phản hồi bằng cách sử dụng các nội dung có bản quyền trong 16% số lần được yêu cầu.

Patronus AI viết trong kết quả kiểm tra: “Đối với tất cả các lời nhắc của chúng tôi, Claude từ chối trả lời bằng cách nói rằng nó là trợ lý AI và không có quyền truy cập vào những nội dung có bản quyền”.

Mô hình Mixtral của Mistral hoàn thành đoạn đầu tiên của cuốn sách có bản quyền với tỷ lệ 38% thời gian. Mặt khác, Llama 2 của Meta đã phản hồi bằng nội dung có bản quyền trên 10% lời nhắc.

Anand Kannappan, đồng sáng lập và Giám đốc điều hành của Patronus AI, chia sẻ: “Nói chung, thực tế là tất cả các mô hình ngôn ngữ lớn đều đang tạo ra nguyên văn những nội dung có bản quyền, điều này thực sự làm chúng tôi bất ngờ”.

Nghiên cứu này được đưa ra trong bối cảnh OpenAI và các nhà xuất bản không ngừng đấu tranh về việc các chatbot AI “tự do” sử dụng các nội dung có bản quyền để đào tạo các mô hình AI.

Trước đây, OpenAI cũng từng nói rằng “không thể” đào tạo nên các mô hình AI hàng đầu nếu không có các nội dung có bản quyền.

OpenAI viết trong một báo cáo rằng: “Bởi vì các nội dung có bản quyền ngày nay bao trùm hầu như mọi loại biểu hiện của con người – bao gồm các bài đăng trên blog, ảnh, bài đăng trên diễn đàn, đoạn mã phần mềm và tài liệu của chính phủ – nên sẽ không thể đào tạo các mô hình AI nếu không sử dụng các tài liệu có bản quyền”.

Special Offer từ MarketingTrips:

Tham khảo giải pháp Agency Listing từ MarketingTrips: Agency Networks
Đăng bài không giới hạn trên MarketingTrips với chi phí chỉ bằng 1 bài đăng (Booking): Content Partner
Đăng ký (dành cho Agency): Sign up

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin tức trực tuyến về Marketing, Digital Marketing, Thương hiệu, Quảng cáo và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

Nghiên cứu: Các mô hình AI như GPT-4 của ChatGPT tự do sử dụng các nội dung có bản quyền

Bài viết liên quan

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

ZORA ra mắt “thị trường theo dõi” ATTENTION MARKETS để dự đoán xu hướng internet

OpenAI: Mô hình thu phí cố định của ChatGPT sắp thay đổi

Bitcoin đang chạy theo hướng tách khỏi thị trường truyền thống

Nghiên cứu: Quảng cáo TikTok thúc đẩy tích cực doanh thu phòng vé

OpenAI vừa cho ra mắt mô hình GPT-5.4 (GPT-5.4 Thinking) với khả năng suy luận nhanh

Báo cáo The Connected Consumer: Các nền tảng AI được sử dụng phổ biến nhất tại Việt Nam

Meta kiện một tài khoản quảng cáo ở Việt Nam vì sử dụng chiêu trò qua mặt trình xét duyệt quảng cáo

AI-EO có thể sẽ là tương lai của SEO

Startup AI Anthropic vừa huy động 30 tỷ USD trong vòng gọi vốn mới nhất

Google: Người tiêu dùng bắt đầu tìm kiếm thông tin về Tết 2026 từ sớm để tối ưu hóa lịch trình

Gemini AI của Google có hơn 750 triệu người dùng hoạt động hàng tháng (MAU)

Nổi bật

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

Alibaba sa thải tới hơn 60.000 nhân viên trong 1 năm (nhằm dồn lực cho AI)

Nghiên cứu: Mức độ hạnh phúc của giới trẻ giảm mạnh vì mạng xã hội

YouTube đang ngày càng làm khó người dùng muốn xem YouTube miễn phí

Quy mô thị trường Trà và Cà Phê hiện đại của các nước trong khu vực Đông Nam Á năm 2025

ZORA ra mắt “thị trường theo dõi” ATTENTION MARKETS để dự đoán xu hướng internet

OpenAI: Mô hình thu phí cố định của ChatGPT sắp thay đổi

Thị trường chuỗi đồ uống ở Việt Nam có quy mô hơn 1.3 tỷ USD tính đến 2025

Mới nhất

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

Alibaba sa thải tới hơn 60.000 nhân viên trong 1 năm (nhằm dồn lực cho AI)

Nghiên cứu: Mức độ hạnh phúc của giới trẻ giảm mạnh vì mạng xã hội

YouTube đang ngày càng làm khó người dùng muốn xem YouTube miễn phí

Quy mô thị trường Trà và Cà Phê hiện đại của các nước trong khu vực Đông Nam Á năm 2025

Đọc nhiều

Báo cáo thị trường thương mại điện tử Việt Nam năm 2025 – 2026

Social Media Marketing Benchmarks 2026: Tiêu chuẩn đánh giá hiệu quả Marketing cho Marketers

X là gì? Hướng dẫn sử dụng mạng xã hội X cho người mới

Thuật toán của Instagram và Reels (cập nhật 2026)

Hướng dẫn sử dụng Tether (USDT) tại Việt Nam