AI xử lý các nhiệm vụ trong thế giới thực với trình điều hành của OpenAI
Hãy tưởng tượng bạn yêu cầu AI xử lý các việc vặt trực tuyến của mình—từ đặt vé máy bay đến đặt hàng tạp hóa—và xem nó thực hiện các nhiệm vụ này một cách chính xác.
Tính năng mới của OpenAI, Operator, hứa hẹn chính xác điều này.
Bằng cách kiểm soát trình duyệt ảo, Operator hướng đến mục tiêu đơn giản hóa các công việc kỹ thuật số thông qua các hành động thời gian thực.
Tuy nhiên, mức giá cao và tính độc quyền của nó đã gây ra nhiều cuộc tranh luận về khả năng tiếp cận và tính công bằng.
Bản bổ sung mới nhất này, được công bố sáng nay, chỉ dành riêng cho những người đăng ký gói Pro tại Hoa Kỳ với mức giá 200 đô la mỗi tháng.
Sự ra mắt này đánh dấu bước đầu tiên của OpenAI vào lĩnh vực duyệt web tự động, mang đến cho người dùng một cách sáng tạo để quản lý các hoạt động trực tuyến hàng ngày.
Cách thức hoạt động của người vận hành đằng sau hậu trường
Không giống như các công cụ trước đây dựa vào API, Operator sử dụng trình duyệt đám mây mô phỏng các hành động của con người.
Nó điều hướng các trang web bằng cách nhấp vào các nút, điền vào biểu mẫu và diễn giải bố cục trang web.
Mỗi hành động đều được ghi lại bằng ảnh chụp màn hình, giúp người dùng nắm được tiến trình.
Ví dụ, khi đặt vé sự kiện, Nhà điều hành sẽ tìm kiếm các lựa chọn, chọn ưu đãi tốt nhất và yêu cầu người dùng xác nhận trước khi hoàn tất thanh toán.
Trong những trường hợp phát sinh sự cố, người dùng có thể can thiệp thủ công bằng tùy chọn “Kiểm soát”.
Trọng tâm chức năng của Operator là mô hình AI mới, Computer User Agent (CUA).
Mô hình này cho phép hệ thống xử lý các thay đổi bất ngờ trên trang web, cửa sổ bật lên và thông báo lỗi với mức gián đoạn tối thiểu.
Khả năng thích ứng này giúp Operator trở nên khác biệt, cho phép nó hoạt động ngay cả trên các nền tảng không được hỗ trợ.
Khả năng thực tế với phản hồi trực quan
Người vận hành có thể xử lý nhiều nhiệm vụ khác nhau, chẳng hạn như diễn giải danh sách mua sắm viết tay bằng GPT-Vision và đặt hàng tạp hóa từ cửa hàng ưa thích.
Các quan hệ đối tác được cấu hình sẵn với các nền tảng như Uber và DoorDash đảm bảo việc điều hướng dễ dàng hơn khi đặt xe hoặc giao đồ ăn.
Đối với các trang web không được hỗ trợ rõ ràng, Operator vẫn cố gắng thực hiện các tác vụ thông qua khả năng điều khiển của trình duyệt.
Tính linh hoạt này giúp nó vượt trội hơn so với các đối thủ cạnh tranh, trở thành giải pháp đa năng cho các công việc trực tuyến hàng ngày.
Điểm chuẩn ấn tượng vượt trội so với đối thủ
Trong các cuộc thử nghiệm, Operator đã chứng minh hiệu suất vượt trội so với các công cụ tương tự.
Sản phẩm đạt điểm thành thạo 38,1% trên OSWorld, một chuẩn mực để xử lý các hệ điều hành tiêu chuẩn, vượt qua mức 22% của đối thủ cạnh tranh gần nhất.
Trên WebArena, nơi đánh giá khả năng điều hướng thương mại điện tử, Operator đạt 58,1%, vượt trội so với các đối thủ cạnh tranh ở mức 36,2%.
OpenAI đã nêu bật những kết quả này để chứng minh tính hiệu quả và độ tin cậy của Operator trong các ứng dụng thực tế.
Tuy nhiên, họ cảnh báo rằng tính năng này vẫn đang trong giai đoạn xem trước nghiên cứu và đôi khi có thể xảy ra lỗi hoặc sự cố.
Độc quyền và Đắt tiền cho Hiện tại
Hiện tại, Operator chỉ giới hạn cho người dùng Pro, tạo ra rào cản tài chính riêng biệt.
Tính độc quyền này đã làm dấy lên lo ngại về sự xuất hiện của một hệ thống phân cấp, nơi chỉ những người dùng giàu có mới có thể tiếp cận được các khả năng AI tốt nhất.
OpenAI có kế hoạch mở rộng triển khai cho những người đăng ký Plus trong thời gian sớm nhất, với khả năng tiếp cận rộng rãi hơn thông qua API, điều này có thể tạo ra các công cụ tự động hóa mới cho các nhà phát triển.
Mối quan tâm về quyền riêng tư và các vấn đề về lòng tin
Một nhược điểm đáng chú ý là Operator phụ thuộc vào thông tin đăng nhập của người dùng để hoàn thành nhiệm vụ.
Vì hoạt động thông qua trình duyệt đám mây, người dùng phải đăng nhập từ xa, điều này rất đáng tin cậy vào cam kết của OpenAI rằng dữ liệu nhạy cảm sẽ không được lưu trữ.
Đối với những người coi trọng quyền riêng tư, sự phụ thuộc vào máy chủ của OpenAI có thể là một vấn đề nghiêm trọng.
Cách nhà điều hành xử lý rủi ro
Bản nâng cấp Operator của OpenAI có đáng giá 200 đô la không?
Ngoài khả năng điều khiển duyệt web mới, OpenAI đang mở rộng các tác nhân AI của mình để nâng cao hơn nữa khả năng của trợ lý hiện tại.
Các tác nhân bổ sung này được thiết lập để hỗ trợ cho Operator, nhưng chức năng cụ thể vẫn chưa được tiết lộ.
Hiện tại, Operator đại diện cho bước tiến đáng kể trong tự động hóa dựa trên AI, hợp lý hóa các tác vụ hàng ngày như đặt vé máy bay và gọi đồ ăn.
Tuy nhiên, liệu bản nâng cấp mới này có thực sự xứng đáng với mức phí hàng tháng đắt đỏ là 200 đô la không?
Mặc dù Operator mang lại sự tiện lợi nhưng nó cũng làm mất đi trải nghiệm quản lý các tác vụ này theo cách thủ công và vẫn cần có sự giám sát để đảm bảo mọi thứ diễn ra suôn sẻ.
Sự phụ thuộc vào sự giám sát của con người có thể khiến hệ thống kém hấp dẫn hơn đối với những người đang tìm kiếm giải pháp hoàn toàn tự động.
Khi OpenAI tiếp tục khám phá những cách mới để mở rộng dịch vụ của mình, giá trị của bản cập nhật này vẫn còn gây tranh cãi.