OpenAI ra mắt GPTBot, sản phẩm của họbot thu thập dữ liệu web mới nhất , đã khuấy động dự đoán về bản phát hành GPT-5 sắp tới, như được chỉ ra bởinộp đơn nhãn hiệu .
Động thái này, mặc dù nhằm mục đích tăng cường đào tạo AI, nhưng đã làm dấy lên các cuộc thảo luận xung quanh sự đồng ý và tính minh bạch.
OpenAI đã giới thiệu GPTBot để tích lũy nguồn dữ liệu rộng hơn cho các hệ thống AI thế hệ tiếp theo của họ.
Mục đích của công ty là mở rộng tập dữ liệu của họ đồng thời thực hiện các bước để giải quyết các vấn đề về quyền riêng tư và bản quyền.
GPTBot được thiết kế để thu thập dữ liệu có thể truy cập công khai từ các trang web, áp dụng hệ thống chọn không tham gia tương tự như các công cụ tìm kiếm phổ biến như Google, Bing và Yandex.
Nó giả định rằng dữ liệu có thể sử dụng được trừ khi chủ sở hữu trang web sử dụng tùy chọn "không cho phép" quy tắc trong tệp máy chủ để ngăn trình thu thập thông tin truy cập vào nội dung của chúng.
OpenAI khẳng định GPTBot sẽ chủ động quét dữ liệu thu thập được để loại bỏ những thông tin, nội dung nhạy cảm vi phạm chính sách của họ.
Một số nhà đạo đức công nghệ bày tỏ sự dè dặt về phương pháp chọn không tham gia, lưu ý những thách thức tiềm ẩn liên quan đến sự đồng ý.
Trong khi một số người dùng ủng hộ nhu cầu về dữ liệu toàn diện của OpenAI, thì những người khác lại bày tỏ lo ngại về sự phân bổ hợp lý và tính minh bạch, so sánh thực tiễn này với các tác phẩm phái sinh không có trích dẫn.
Đơn đăng ký nhãn hiệu "GPT-5" tăng thêm sức nặng cho giả định rằng OpenAI đang chuẩn bị phát hành mô hình AI tiếp theo của họ.
Bước này cho thấy sự thay đổi theo hướng tiếp cận thu thập dữ liệu mở rộng hơn, nhấn mạnh tầm quan trọng của dữ liệu đào tạo đa dạng và cập nhật.
ChatGPT tự hào có cơ sở người dùng rộng lớn, thu hút hơn 1,5 tỷ người dùng hoạt động hàng tháng.
Hạn chế quyền truy cập GPTBot
Trong trường hợp chủ sở hữu trang web có ý định hạn chế quyền truy cập của GPTBot vào trang web của họ, họ có thể điều chỉnh tệp robots.txt của mình.
Nếu muốn làm điều này, họ có thể chặn quyền truy cập của GPTBot vào toàn bộ trang web của họ.
Tuy nhiên, những người muốn cấp quyền truy cập một phần có thể làm như vậy bằng cách tùy chỉnh các thư mục mà GPTBot có thể truy cập.
Để làm điều này, họ phải chỉnh sửa tệp robots.txt của mình.