Reddit có hành động pháp lý chống lại Anthropic vì sử dụng dữ liệu
Reddit đã ra mắt mộtvụ kiện chống lại công ty khởi nghiệp AI Anthropic , cáo buộc công ty sử dụng hàng triệu bình luận của người dùng mà không được phép để đào tạo chatbot Claude.
Vụ kiện cáo buộc Anthropic đã thu thập dữ liệu từ nền tảng của Reddit mặc dù đã được yêu cầu dừng lại, vi phạm thỏa thuận của người dùng và không bồi thường cho trang mạng xã hội này.
Nguồn: The Verge
Anthropic đã sử dụng dữ liệu nào và truy cập dữ liệu đó như thế nào?
Theo đơn khiếu nại được đệ trình lên tòa án California, Anthropic đã khai thác nội dung của Reddit kể từ tháng 12 năm 2021.
Mặc dù công khai tuyên bố đã chặn bot truy cập Reddit, hệ thống tự động của công ty khởi nghiệp này được cho là đã thực hiện hơn 100.000 lần thu thập dữ liệu sau thời điểm đó.
Giám đốc điều hành của công ty, Dario Amodei, thậm chí còn đồng sáng tác nghiên cứu xác định các bài đăng chất lượng cao trên Reddit là lý tưởng để đào tạo các mô hình AI.
Vụ kiện nêu bật một mâu thuẫn trong hành vi của Anthropic: trong khi tự nhận mình là nhà phát triển AI có trách nhiệm và đạo đức, Anthropic bị cáo buộc đã bỏ qua các ranh giới pháp lý để có được nội dung người dùng có giá trị.
Khiếu nại viết rằng,
“Vụ án này liên quan đến hai mặt của Anthropic: mặt công chúng cố gắng lấy lòng [...] và mặt riêng tư phớt lờ mọi quy tắc.”
Nguồn: The Verge
Tại sao Reddit quan tâm đến việc sử dụng dữ liệu?
Mạng lưới rộng lớn của Reddit với hơn 100.000 subreddit và hàng triệu người dùng hoạt động hàng ngày tạo ra nguồn dữ liệu hội thoại phong phú.
Điều này khiến nền tảng này đặc biệt có giá trị đối với các công ty AI muốn cải thiện mô hình ngôn ngữ của họ.
Reddit đã ký thỏa thuận cấp phép với các công ty lớn như OpenAI và Google, đảm bảo các công ty này trả tiền cho quyền sử dụng nội dung Reddit theo các điều khoản bảo vệ quyền riêng tư của người dùng.
Trong một tuyên bố, Ben Lee, giám đốc pháp lý của Reddit, cho biết,
“Các công ty AI không được phép thu thập thông tin và nội dung từ mọi người mà không có giới hạn rõ ràng về cách họ có thể sử dụng dữ liệu đó.”
Ông nhấn mạnh rằng Reddit coi trọng tính mở của internet nhưng phản đối việc khai thác nó để kiếm lợi nhuận mà không có sự đồng ý hoặc bồi thường.
Anthropic phản ứng thế nào với vụ kiện?
Anthropic, được Amazon hậu thuẫn và được định giá hơn 61 tỷ đô la Mỹ, đã bác bỏ cáo buộc của Reddit.
Trong một tuyên bố gửi tới AFP, công ty cho biết,
“Chúng tôi không đồng ý với những tuyên bố của Reddit và sẽ tự bảo vệ mình một cách mạnh mẽ.”
Được biết đến với việc tập trung vào sự an toàn của AI và phát triển có trách nhiệm, Anthropic gần đây đã phát hành mô hình mới nhất của mình, Claude Opus 4, đã nhận được phản hồi tích cực trong cộng đồng AI.
Cuộc đụng độ rộng hơn giữa những người sáng tạo nội dung và các công ty AI
Tranh chấp pháp lý này là một phần của cuộc xung đột lớn hơn liên quan đến những người sáng tạo nội dung và các công ty AI về việc sử dụng dữ liệu mà không được phép.
Các tác giả, nghệ sĩ, nhạc sĩ và tổ chức tin tức ngày càng có nhiều hành động pháp lý chống lại các công ty AI bị cáo buộc sử dụng tác phẩm của họ mà không có sự đồng ý hoặc bồi thường.
Trong số các vụ kiện ngày càng tăng, Anthropic đang phải đối mặt với nhiều vụ kiện từ các ngành công nghiệp sáng tạo.
Trong một trường hợp,một nhóm tác giả đã đệ đơn kiện tập thể ở California, cáo buộc công ty xây dựng doanh nghiệp của mình bằng cách sao chép số lượng lớn sách có bản quyền.
Trong một vụ việc khác, Universal Music đã có hành động pháp lý tại Tennessee, cáo buộc Anthropic đã sử dụng trái phép lời bài hát trên diện rộng để đào tạo các mô hình AI của mình.
Trong khi các nhà phát triển AI cho rằng việc đào tạo về nội dung như vậy đủ điều kiện được coi là sử dụng hợp lý và hỗ trợ đổi mới, những thách thức pháp lý này đặt ra những câu hỏi cấp bách về quyền sở hữu dữ liệu, sở hữu trí tuệ và bồi thường.
Kết quả của những vụ việc này có thể đóng vai trò quan trọng trong việc định hình các quy tắc tương lai chi phối cách thức đào tạo hệ thống AI và cách thức bảo vệ quyền sáng tạo.
Cổ phiếu của Reddit đã phản ứng thế nào?
Sau thông báo về vụ kiện, cổ phiếu của Reddit đã tăng 6,6 phần trăm, phản ánh sự tin tưởng của các nhà đầu tư vào lập trường của công ty trong việc bảo vệ nội dung và đảm bảo doanh thu cấp phép.
Reddit lên sàn vào năm 2024, với các thỏa thuận cấp phép từ các công ty AI lớn giúp thúc đẩy giá trị thị trường của công ty.
Kết quả của vụ kiện này có thể gây ra hậu quả đáng kể không chỉ đối với Reddit và Anthropic mà còn đối với tương lai phát triển AI và quyền của các nhà cung cấp nội dung trong thời đại kỹ thuật số.