Reddit đã đệ đơn kiện Perplexity AI và ba công ty khác, cáo buộc họ thu thập dữ liệu từ trang Reddit mà không được phép. Theo đơn kiện được đệ trình hôm thứ Tư tại tòa án liên bang Manhattan, các công ty thu thập dữ liệu Oxylabs UAB, AWMProxy và SerpApi đã thu thập dữ liệu Reddit thông qua kết quả tìm kiếm của Google với mục đích bán lại. Đơn kiện cáo buộc rằng Perplexity đã mua dữ liệu từ ít nhất một trong số các công ty này. Với sự gia tăng của các mô hình AI dựa vào lượng lớn dữ liệu để đào tạo và cung cấp kết quả có liên quan, kho dữ liệu ngày càng phát triển của Reddit đã trở thành một mặt hàng có giá trị. Reddit đã ký thỏa thuận với OpenAI và Alphabet để cấp phép sử dụng dữ liệu Reddit cho mục đích đào tạo, nhưng cũng đã có hành động pháp lý đối với một số công ty không có thỏa thuận chính thức với Reddit. Đầu năm nay, Reddit đã đệ đơn kiện thu thập dữ liệu tương tự đối với Anthropic tại tòa án San Francisco.