AI 상담원이 통화 도중 머신 토크로 전환하기
두 명의 AI 에이전트가 대화 도중 서로를 알아보고 인간의 언어를 버리고 기계 전용 방언을 사용하는 바이럴 영상이 흥미를 불러일으키고 있습니다.
공유X(이전의 트위터) 영상에서는 AI 소프트웨어를 실행하는 휴대폰과 노트북을 보여줍니다.
처음에는 한 상담원이 자신을 소개하며 예약에 대한 도움을 요청합니다.
두 에이전트 모두 AI라는 사실을 알게 된 두 번째 에이전트는 메타 엔지니어인 Anton Pidkuiko와 Boris Starkov가 개발한 독점 언어인 '지버링크 모드'로 전환할 것을 제안합니다.
스타코프는 화요일에 링크드인에 글을 올렸습니다:
"우리는 다음과 같은 세상에서AI 에이전트 가 전화를 걸고 받을 수 있게 되면 가끔씩 서로 대화를 나누게 되는데, 이를 위해 사람과 같은 음성을 생성하는 것은 컴퓨팅, 비용, 시간, 환경 낭비입니다. 대신 서로를 AI로 인식하는 순간 더 효율적인 프로토콜로 전환해야 합니다."
Gibberlink는 1980년대 전화 접속 모뎀을 연상시키는 오디오 기반 데이터 전송 방식인 GGWave를 사용하며, 안정성과 사용 편의성 때문에 선택되었습니다.
회의론자들은 이 동영상의 진위 여부에 의문을 제기했지만, 스타코프는 AI 음성 생성기 회사인 ElevenLabs가 이 코드를 감사했다고 밝혔습니다.
AI 에이전트 사용 사례
로드리 투자, 공동 창업자AI 에이전트 개발사인 Crossmint는 이 영상이 커머스 및 금융과 같은 산업 전반에서 AI의 잠재력을 엿볼 수 있는 매력적인 영상이라고 평가합니다.
투자는 이렇게 설명했습니다:
"개인 비서 AI 에이전트가 폭발적으로 증가하면서 고객 지원팀과의 통화와 같은 집안일을 처리하는 데 AI 에이전트에 의존하는 사람들이 늘어남에 따라 사용 사례는 매우 현실적입니다. 마찬가지로 고객 지원을 위해 특별히 설계된 AI 에이전트도 급증하고 있어 이러한 현상이 보편화되는 것은 시간 문제일 뿐입니다."
그러나 그는 이러한 상호작용이 다소 연출된 것처럼 보인다고 지적했습니다.
그는 이렇게 말했습니다:
"AI 대화는 가능하면 텍스트나 다른 메커니즘을 통해 이루어지는 경향이 더 큽니다."
비디오에서 볼 수 있듯이 오디오 전송은 압축할 수 있지만, 투자는 여전히 AI 간 커뮤니케이션을 위한 비효율적인 매체라고 주장했습니다.
AI 에이전트의 자율성을 고려할 때, 그는 결국 기업이 인간 사용자를 위한 지원 채널과 AI 에이전트 전용 지원 채널을 별도로 구축할 수 있을 것이라고 추측했습니다.
그는 덧붙였습니다:
"상담원이 회사에 지원을 요청하기 위해 핑을 보내려고 할 때 문자/API 메커니즘을 통해 요청을 보내면 통화나 음성이 전혀 필요하지 않습니다. 다른 경우에는 상담원이 그러한 채널의 존재를 인식하지 못하고 표준 지원 채널로 직접 소통하려고 할 수도 있습니다."