OpenAI의 오퍼레이터로 실제 작업을 처리하는 AI
인공지능에게 항공권 예약부터 식료품 주문까지 온라인 심부름을 부탁하고 인공지능이 이러한 작업을 정확하게 수행하는 것을 지켜본다고 상상해 보세요.
OpenAI의 새로운 기능인 오퍼레이터는 바로 이 점을 약속합니다.
오퍼레이터는 가상 브라우저를 제어함으로써 실시간 작업을 통해 디지털 집안일을 간소화하는 것을 목표로 합니다.
그러나 비싼 가격대와 독점성으로 인해 접근성과 공정성에 대한 논쟁이 벌어지고 있습니다.
오늘 오전에 발표된 이 최신 기능은 미국 내 Pro 구독자에게만 제공되며, 월 200달러의 요금이 부과됩니다.
이번 출시는 OpenAI가 자율 웹 브라우징에 첫발을 내디딘 것으로, 사용자에게 일상적인 온라인 활동을 관리할 수 있는 혁신적인 방법을 제공합니다.
운영자의 백그라운드 작동 방식
API에 의존하는 이전 도구와 달리 오퍼레이터는 사람의 동작을 모방하는 클라우드 기반 브라우저를 사용합니다.
버튼을 클릭하고, 양식을 작성하고, 웹사이트 레이아웃을 해석하여 웹사이트를 탐색합니다.
각 작업은 스크린샷과 함께 문서화되어 사용자에게 진행 상황을 알려줍니다.
예를 들어, 이벤트 티켓을 예약할 때 운영자는 옵션을 검색하고 최적의 상품을 선택한 후 결제를 완료하기 전에 사용자 확인을 요청합니다.
문제가 발생하는 시나리오에서 사용자는 '제어권 가져오기' 옵션을 사용하여 수동으로 개입할 수 있습니다.
오퍼레이터 기능의 핵심은 새로운 AI 모델인 컴퓨터 사용자 에이전트(CUA)입니다.
이 모델을 사용하면 시스템이 예기치 않은 웹사이트 변경, 팝업 및 오류 메시지를 최소한의 중단으로 처리할 수 있습니다.
이러한 적응성으로 인해 Operator는 지원되지 않는 플랫폼에서도 작동할 수 있는 차별화된 기능을 제공합니다.
시각적 피드백을 통한 실제 기능
운영자는 GPT-Vision을 사용하여 손으로 쓴 쇼핑 목록을 해석하고 선호하는 매장에서 식료품을 주문하는 등 다양한 작업을 처리할 수 있습니다.
Uber 및 DoorDash와 같은 플랫폼과 사전 구성된 파트너십을 통해 차량 서비스 예약이나 음식 배달을 더욱 원활하게 이용할 수 있습니다.
명시적으로 지원되지 않는 웹사이트의 경우 운영자는 여전히 브라우저 제어 기능을 통해 작업을 실행하려고 시도합니다.
이러한 유연성으로 경쟁사보다 우위를 점할 수 있어 일상적인 온라인 집안일을 위한 다목적 솔루션이 될 수 있습니다.
경쟁사를 능가하는 인상적인 벤치마크 성과
테스트에서 오퍼레이터는 유사한 도구에 비해 우수한 성능을 보여주었습니다.
표준 운영 체제 처리 벤치마크인 OSWorld에서 38.1%의 숙련도 점수를 획득하여 가장 근접한 경쟁사의 22%를 능가했습니다.
이커머스 내비게이션을 평가하는 웹아레나에서 운영자는 58.1%를 기록해 36.2%를 기록한 경쟁사보다 높은 점수를 받았습니다.
OpenAI는 이러한 결과를 강조하여 실제 애플리케이션에서 오퍼레이터의 효율성과 신뢰성을 보여주었습니다.
그러나 이 기능은 아직 연구용 미리보기 단계에 있으며 가끔 오류나 버그가 발생할 수 있다고 경고합니다.
현재로서는 독점적이고 비싼
현재 운영자는 프로 사용자로 제한되어 있어 재정적 장벽이 뚜렷합니다.
이러한 독점성으로 인해 부유한 사용자만 최고의 AI 기능을 이용할 수 있는 계층화된 시스템의 출현에 대한 우려가 제기되었습니다.
OpenAI는 곧 플러스 가입자를 대상으로 출시를 확대할 계획이며, 개발자를 위한 새로운 자동화 도구를 촉발할 수 있는 API를 통해 더 많은 기능을 제공할 예정입니다.
개인정보 보호 우려 및 신뢰 문제
한 가지 주목할 만한 단점은 운영자가 작업을 완료하기 위해 사용자 자격 증명에 의존한다는 점입니다.
클라우드 브라우저를 통해 작동하므로 사용자는 원격으로 로그인해야 하며, 민감한 데이터가 저장되지 않을 것이라는 OpenAI의 보증을 크게 신뢰해야 합니다.
개인 정보 보호에 민감한 개인에게는 OpenAI 서버에 대한 이러한 의존성이 거래의 걸림돌이 될 수 있습니다.
운영자가 위험을 처리하는 방법
OpenAI의 운영자 업그레이드는 200달러라는 가격표의 가치가 있을까요?
OpenAI는 새로운 웹 브라우징 제어 기능 외에도 현재 어시스턴트의 기능을 더욱 강화하기 위해 AI 에이전트를 확장하고 있습니다.
이러한 추가 에이전트는 오퍼레이터를 보완하기 위해 설정되었지만 구체적인 기능은 아직 공개되지 않았습니다.
현재 오퍼레이터는 항공권 예약이나 음식 주문과 같은 일상적인 업무를 간소화하여 AI 기반 자동화의 중요한 진전을 보여줍니다.
하지만 이 새로운 업그레이드가 과연 월 200달러라는 거액의 비용을 지불할 가치가 있을까요?
오퍼레이터는 편리함을 제공하지만, 이러한 작업을 수동으로 관리해야 하는 번거로움이 있고 모든 것이 원활하게 진행되도록 감독해야 하는 번거로움도 있습니다.
사람의 감독에 의존하는 이 시스템은 완전히 자율적인 솔루션을 원하는 사람들에게는 그다지 매력적이지 않을 수 있습니다.
OpenAI가 서비스를 확장하기 위한 새로운 방법을 계속 모색하고 있는 가운데, 이 업데이트의 가치는 여전히 논란의 여지가 있습니다.