OpenAI: Nếu không sử dụng nội dung có bản quyền, việc đào tạo AI là không thể

9 Tháng Một, 2024

Đối mặt với các vụ kiện, OpenAI cho rằng nếu không sử dụng nội dung có bản quyền, việc đào tạo những AI hàng đầu là “không thể”.

OpenAI: Nếu không sử dụng nội dung có bản quyền, việc đào tạo AI là không thể

“Khái niệm bản quyền ngày nay bao trùm gần như mọi loại biểu hiện của con người, từ bài đăng blog, diễn đàn, hình ảnh cho đến mã code phần mềm và tài liệu, nên không thể đào tạo mô hình AI hàng đầu nếu không sử dụng tài liệu có bản quyền”, OpenAI nêu trong bức thư gửi lên Ủy ban Kỹ thuật số và Truyền thông thuộc Hạ viện Anh cuối tuần trước, sau khi cơ quan này điều tra về rủi ro đối với các mô hình AI như ChatGPT.

Theo bản đệ trình, nếu chỉ lấy dữ liệu miễn phí vốn đã có cách đây hàng thập kỷ để huấn luyện, AI “chỉ mang lại trải nghiệm thú vị nhưng không đáp ứng đủ các yêu cầu mà người dùng ngày nay cần”. OpenAI khẳng định sẽ tuân thủ luật bản quyền, nhưng “còn nhiều việc phải làm để hỗ trợ cho người sáng tạo”.

OpenAI đang trong tầm ngắm về bản quyền, khi giới nhà văn, nghệ sĩ, nhà khoa học… cáo buộc các mô hình như ChatGPT sử dụng tác phẩm của họ để đào tạo mà không xin phép hoặc trả tiền tác quyền.

Cuối năm ngoái, New York Times đã nộp đơn kiện với lý do OpenAI và Microsoft sử dụng hàng triệu bài báo để đào tạo các mô hình ngôn ngữ lớn (LLM).

Ngày 6/1, hai nhà văn và nhà báo cũng kiện hai công ty này vì sử dụng tác phẩm của họ để làm dữ liệu huấn luyện mô hình GPT.

Các mô hình LLM như ChatGPT hoạt động bằng cách thu thập tài nguyên khổng lồ trên Internet, sau đó phân tích các mối liên hệ, phát triển khả năng dự đoán từ nào sẽ nói tiếp theo trong câu để bắt chước lời nói của con người. OpenAI, Microsoft và Google nhiều lần từ chối tiết lộ dùng dữ liệu gì để đào tạo AI, nhưng các LLM trước đây được chứng minh đã sử dụng lượng lớn nội dung có bản quyền.

Nghiên cứu được công bố ngày 5/1 của Hiệp hội Kỹ sư Điện và Điện tử IEEE cho thấy Midjourney và Dall-E 3 của OpenAI, hai trong số các mô hình AI tạo ảnh, có thể dựng lại cảnh có bản quyền từ phim và trò chơi điện tử dựa trên dữ liệu đào tạo chúng.

Về thư của OpenAI gửi lên Hạ viện Anh, Gary Marcus, một trong hai tác giả của nghiên cứu trên, nhận xét trên X: “Họ nói vậy có nghĩa: Chúng tôi sẽ không thể trở nên giàu có nếu bạn không cho chúng tôi ăn trộm, vì vậy đừng bắt chúng tôi phải trả phí bản quyền”.

Tyler Ochoa, giáo sư khoa luật tại Đại học Santa Clara ở California, nói với The Register rằng việc xác định bản quyền trong các tác phẩm AI rất khó thống nhất. “Vấn đề của luật bản quyền là cần xem ai chịu trách nhiệm về những kết quả đạo văn này: người tạo ra mô hình AI, hay người yêu cầu AI tạo ra sản phẩm”, ông nói.

Tham gia Cộng đồng We’re Marketer của MarketingTrips (Trang tin tức trực tuyến về Marketing, Digital Marketing, Thương hiệu, Quảng cáo và Kinh doanh) để thảo luận các chủ đề về Marketing và Business tại: We’re Marketer

OpenAI: Nếu không sử dụng nội dung có bản quyền, việc đào tạo AI là không thể

Bài viết liên quan

Amazon công bố khoản đầu tư hơn 10 tỷ USD vào Ấn Độ

Công ty sở hữu Claude AI đang chuẩn bị cho IPO với định giá gần 1000 tỷ USD

Sáu năm giữa bão crypto: Giải phẫu hành trình một sàn giao dịch từ startup đến hệ sinh thái đa tài sản

Google Chrome âm thầm tải xuống 4 GB dữ liệu mô hình AI trực tiếp về máy tính

Google vừa công bố tích hợp AI vào trình duyệt Chrome giúp tóm tắt nội dung và gửi email

Gmail cho phép thay đổi địa chỉ email (thay vì phải lập tài khoản mới)

Lý do OpenAI đóng cửa ứng dụng tạo video Sora từng gây sốt khi mới ra mắt

Apple kiếm gần 1 tỷ USD từ các ứng dụng AI trên App Store trong năm 2025

ZORA ra mắt “thị trường theo dõi” ATTENTION MARKETS để dự đoán xu hướng internet

OpenAI: Mô hình thu phí cố định của ChatGPT sắp thay đổi

Bitcoin đang chạy theo hướng tách khỏi thị trường truyền thống

Nghiên cứu: Quảng cáo TikTok thúc đẩy tích cực doanh thu phòng vé

Nổi bật

Báo cáo từ Gallup: Người lao động Việt Nam ít stress nhất Đông Nam Á

Thêm một thương hiệu thời trang Việt Nam được nhà đầu tư ngoại rót vốn

Nhà sáng lập DeepSeek trở thành tỷ phú AI giàu nhất thế giới với 36 tỷ USD

Mô hình kinh doanh tỷ USD đứng sau đế chế gọi xe Grab

Every Half Coffee Roasters (Every Half) vừa công bố hoàn tất vòng gọi vốn Series A trị giá 8 triệu USD

Social Media Marketing Benchmarks 2026: Tiêu chuẩn đánh giá hiệu quả Marketing cho Marketers

Virgin Media bị phạt hơn 35 triệu USD vì cố tình ngăn cản khách hàng hủy hợp đồng

Doanh thu của công ty mẹ Uniqlo năm 2026 tăng mạnh so với năm 2025

Mới nhất

Báo cáo từ Gallup: Người lao động Việt Nam ít stress nhất Đông Nam Á

Thêm một thương hiệu thời trang Việt Nam được nhà đầu tư ngoại rót vốn

Nhà sáng lập DeepSeek trở thành tỷ phú AI giàu nhất thế giới với 36 tỷ USD

Mô hình kinh doanh tỷ USD đứng sau đế chế gọi xe Grab

Every Half Coffee Roasters (Every Half) vừa công bố hoàn tất vòng gọi vốn Series A trị giá 8 triệu USD

Đọc nhiều

X là gì? Hướng dẫn sử dụng mạng xã hội X cho người mới

Báo cáo thị trường thương mại điện tử Việt Nam năm 2025 – 2026

Shopee và Meta vừa chính thức công bố triển khai chương trình Tiếp thị liên kết (Affiliate Marketing) trên Instagram tại Việt Nam

Các doanh nghiệp cần làm gì trong thời điểm vàng của thương mại điện tử

Social Media Marketing Benchmarks 2026: Tiêu chuẩn đánh giá hiệu quả Marketing cho Marketers