Các tác nhân AI chuyển sang nói chuyện với máy giữa cuộc gọi
Một video lan truyền đã gây tò mò khi hai tác nhân AI, đang trò chuyện, nhận ra nhau và từ bỏ ngôn ngữ của con người để chuyển sang phương ngữ chỉ dành cho máy móc.
Chia sẻ trênX (trước đây gọi là Twitter) , đoạn clip cho thấy một chiếc điện thoại di động và máy tính xách tay đang chạy phần mềm AI.
Đầu tiên, một nhân viên giới thiệu bản thân và yêu cầu giúp đỡ đặt chỗ.
Khi nhận ra cả hai đều là AI, tác nhân thứ hai đề xuất chuyển sang "chế độ Gibberlink", một ngôn ngữ độc quyền do các kỹ sư của Meta là Anton Pidkuiko và Boris Starkov phát triển.
Starkov viết trên Linkedin vào thứ ba:
“Chúng tôi muốn cho thấy rằng trên thế giới nơiCác tác nhân AI có thể thực hiện và nhận cuộc gọi điện thoại, đôi khi họ sẽ nói chuyện với nhau — và việc tạo ra giọng nói giống con người cho việc đó sẽ lãng phí điện toán, tiền bạc, thời gian và môi trường. Thay vào đó, họ nên chuyển sang một giao thức hiệu quả hơn ngay khi họ nhận ra nhau là AI.”
Gibberlink sử dụng GGWave, một phương pháp truyền dữ liệu dựa trên âm thanh gợi nhớ đến modem quay số những năm 1980, được lựa chọn vì tính ổn định và dễ sử dụng.
Trong khi những người hoài nghi đặt câu hỏi về tính xác thực của video, Starkov tuyên bố rằng công ty tạo giọng nói AI ElevenLabs đã kiểm tra mã.
Trường hợp sử dụng của tác nhân AI
Rodri Touza, đồng sáng lập củaĐại lý AI nhà phát triển Crossmint coi video này là cái nhìn hấp dẫn về tiềm năng của AI trong các ngành như thương mại và tài chính.
Touza giải thích:
“Trường hợp sử dụng này rất thực tế, vì chúng ta đang chứng kiến sự bùng nổ của các tác nhân AI trợ lý cá nhân, với nhiều người dựa vào chúng để xử lý các công việc như nói chuyện với bộ phận hỗ trợ khách hàng. Tương tự như vậy, có một sự gia tăng các tác nhân AI được thiết kế riêng cho bộ phận hỗ trợ khách hàng, khiến chỉ còn là vấn đề thời gian trước khi điều này trở nên phổ biến.”
Tuy nhiên, ông lưu ý rằng sự tương tác này có vẻ hơi dàn dựng.
Ông nói:
“Các cuộc trò chuyện AI có xu hướng diễn ra thông qua văn bản hoặc các cơ chế khác khi có thể.”
Mặc dù truyền âm thanh có thể được nén lại như trong video, Touza cho rằng đây vẫn là phương tiện kém hiệu quả cho giao tiếp giữa AI với AI.
Với tính tự chủ của các tác nhân AI, ông suy đoán rằng cuối cùng các doanh nghiệp có thể thiết lập các kênh hỗ trợ riêng biệt - một kênh dành cho người dùng và một kênh khác dành riêng cho các tác nhân AI.
Ông nói thêm:
“Khi nhân viên muốn ping một công ty để được hỗ trợ, họ chỉ cần gửi yêu cầu qua cơ chế văn bản/API và không yêu cầu cuộc gọi hoặc âm thanh nào cả. Trong những trường hợp khác, nhân viên có thể không nhận ra kênh như vậy tồn tại và có thể cố gắng tương tác trực tiếp với kênh hỗ trợ tiêu chuẩn.”