저자: jolestar 출처: X, @jolestar
지난 주에는 AI 에이전트를 살펴보고, 그 전날에는 베이징에서 열린 ai16z의 행사에 참석하여 현재 AI 에이전트가 실제로 어떤 일을 할 수 있는지 살펴봤습니다. AI 에이전트가 실제로 현재 어떤 일을 할 수 있는지 살펴보고 미래에 어떤 일을 할 수 있을지 생각해보고 싶었습니다.
AI 에이전트의 현재 모습은 자판기 안에 숨어 있는 사람의 모습을 떠올리게 합니다. 우리는 모두 AI 에이전트가 자율적으로 작동하기 시작했다고 상상했지만, 실제로는 AI 에이전트 안에 개발자가 숨어 있습니다. (여러분이 생각하고 있는 이미지입니다. 이 이미지를 AI가 생성하도록 했는데, AI가 '숨는 것'을 이해하지 못한다는 것을 알게 되었습니다.
AI 에이전트 프레임워크의 기본 작업
AI 에이전트 프레임워크는 현재 클라이언트(트위터, Discord, 텔레그램 등)와 다양한 플러그인(체인 등)을 하나로 묶어주는 접착제 역할을 하며, 프레임워크는 기본 라이브러리(메모리 저장, 세션 격리, 컨텍스트 생성 등)를 제공합니다. 그런 다음 프레임워크는 기본 라이브러리(메모리 저장, 세션 격리, 컨텍스트 생성 등) 등을 제공하고 다양한 AI 플랫폼에 인터페이스를 제공합니다.
AI 에이전트 프레임워크를 애플리케이션 및 비즈니스 시나리오와 결합하는 방법
작년 AI 폭발 이후. 작년 AI 폭발 이후 다양한 플랫폼과 도구가 등장했는데, 핵심은 AI를 애플리케이션과 어떻게 결합할 수 있느냐는 문제를 해결하는 것입니다. 일부 AI 플랫폼은 플러그인 방식을 제공하고, 일부는 워크플로 모델을 구축하며, 일부 기존 애플리케이션은 애플리케이션 내에 AI를 내장합니다. 하지만 여기서 핵심은 1. 애플리케이션의 상호 작용 입구가 어디인지, 2. 기존 비즈니스 로직과 AI를 어떻게 결합할 것인지입니다.
모든 AI 플랫폼은 앱의 상호작용 포털로 채팅창과 같은 대화 상자를 사용자에게 제공하며, AI 앱과의 상호작용이 '인간적인' 것이어야 한다는 점에는 모두가 동의합니다. AI 에이전트는 모든 개방형 메신저 및 소셜 시스템에 직접 연결된다는 점에서 새로운 시스템보다 훨씬 더 쉽게 받아들일 수 있다는 점에서 스마트합니다.
AI는 기존 비즈니스 로직에 어떻게 적용되나요? AI 에이전트는 개발자가 AI 결정을 비즈니스 시나리오에 통합할 수 있는 솔루션을 제공합니다. 프로그래밍 언어는 결정론적이어야 하며, 조건이 참 또는 거짓으로만 가능하기 때문에 모호한 비즈니스 로직을 처리할 수 없습니다. AI를 사용하면 복잡한 로직을 정확한 조건으로 변환한 다음 비즈니스 시나리오에 원활하게 통합할 수 있습니다.
예를 들어 그룹 내에서 메시지에 답장하려면 기존 메신저 봇에서는 명시적인 메시지 명령으로 트리거해야 하지만, AI를 사용하면 컨텍스트에 따라 참 또는 거짓을 반환하는 shouldReplyMessage 메서드를 구현할 수 있습니다.
이것은 우리가 처음으로 해본 일입니다. style="text-align: 왼쪽;">비즈니스 로직 시나리오에서 AI의 역할은 주로 다음과 같습니다.
1. '의도' 발견: 프롬프트의 프롬프트 단어를 통해
2. 의사 결정 지원: AI가 모호하고 복잡한 조건을 결정론적 참/거짓 또는 열거형 유형으로 변환하여 비즈니스 로직에 통합할 수 있습니다.
이를 보고 많은 사람들이 AI 에이전트에 실망할 수 있는데, 많은 사람들은 AI가 모든 것을 알고 있다고 생각하는 AI 에이전트에 대해 실망할 수 있습니다. 실제로는 대규모 모델의 상황적 제약으로 인해 모든 것을 할 수 있는 만능 AI를 구축할 수 있는 방법은 (적어도 현재로서는) 없습니다. 하지만 좋은 소식은 프로그래머가 일자리를 잃을까 걱정할 필요는 없다는 것입니다. 여전히 많은 프로그래머가 AI 뒤에 숨어 있고, 누군가는 여전히 필요하지만 중요한 차이점은 프로그램이 처리할 수 있는 비즈니스의 경계가 확장되고 있다는 것입니다.
두 가지AI 에이전트
이벤트에서 @shawmakesmagic에게 물어보았습니다. 이날 행사에서 @shawmakesmagic이 질문했는데, 시장에서는 AI 에이전트에 대해 두 가지 기대를 가지고 있는데, 1. AI 에이전트가 스스로 역할을 수행하며 자체적인 아이디와 브랜드를 가지고 사용자에게 서비스를 제공하는 것. 2. 사용자가 개인 비서에 해당하는 개인 AI 에이전트를 가지고 있어 사용자의 업무 일부를 보조하는 것. 이 두 가지 중 어떤 것이 더 나은가. 이 두 가지 AI 에이전트 중 어떤 것이 더 인기가 있을까요? 그는 두 가지 방향 모두 좋을 것이라고 생각하며, 두 가지를 결합하는 것도 가능하다고 생각합니다.
첫 번째 방향은 여전히 사람들이 주로 시장에서 탐색하고 있는 방향입니다. 이 방향은 인공지능 에이전트 서비스와 유사하며, 미래에는 앱 인터페이스가 없을 수도 있고, 앱이 인공지능 에이전트이며, 의인화될 수도 있습니다. 두 번째 방향은 애플리케이션 클라이언트의 에이전트화이며, 미래의 애플리케이션 클라이언트는 어시스턴트 에이전트의 플러그인이 될 것이며 애플리케이션 로컬 데이터는 에이전트 메모리의 일부가되며 플러그인은 클라우드에서 서비스 에이전트와 통신하는 역할도 담당합니다. 그리고 이것은 전체 인프라를 변화시킬 새로운 애플리케이션 아키텍처 모델입니다.
AI 에이전트 인프라 요구 사항
1. 인프라는 접근이 자유로워야 합니다( 무허가), 그렇지 않으면 AI 에이전트는 다양한 공격 방지 전략에 의해 제한될 것이며, 서비스는 경제적 비용으로 (가스) 공격 방지 방식을 사용해야 합니다. 이 시점에서 개방성이 낮은 플랫폼은 큰 타격을 입게 될 것이며, 웹2.0 초기의 오픈 플랫폼 열풍이 다시 불게 될 것입니다.
2. AI 에이전트는 위의 문제 해결을 위한 자금을 운용할 수 있어야 합니다.
즉, 블록체인 기반이든 아니든 미래의 서비스는 암호화폐의 개인키 인증 모델과 암호화폐 기반 결제를 지원해야 할 것입니다.
AI 에이전트와 체인과의 결합
위에서 언급한 두 가지 사항 외에도 AI 에이전트와 체인을 어떻게 결합할 것인가에 대한 문제도 연구되고 있는 분야 중 하나입니다. 체인 결합은 사람들이 탐구하고 있는 방향입니다. 이번 행사에서 @Mikkke_acc가 진행 중인 focEliza 프로젝트에 대해 이야기를 나누었는데, 적어도 위에서 언급한 두 가지 AI 에이전트 중 첫 번째는 체인에서 제공하는 런타임이나 검증 환경이 필요합니다. 왜냐하면 AI 에이전트가 대중에게 서비스를 제공하게 되면 신뢰 문제가 발생하고, 실제로 스마트 컨트랙트와 동일한 역할을 수행하기 때문입니다.
예전에 '스마트 컨트랙트'라는 이름에 대해 '스마트'가 어디 있느냐, 코드에 불과한데 그 안에 '스마트함'이 어디 있느냐는 논란이 있었는데, AI는 이름에 걸맞는 스마트 컨트랙트를 만들 수 있습니다. 문제는 스마트 컨트랙트 환경에서 AI 인터페이스를 호출하는 방법입니다. 검증 가능한 환경에서 대규모 모델을 실행하기까지 갈 길이 멀다면 오라클과 같은 솔루션이 더 실용적인 길입니다.
AI 에이전트에는 AI 에이전트가 공개 지식을 얻는 방법, AI 에이전트가 사실을 판단하는 방법, AI 에이전트가 다른 플랫폼에서 동일한 사용자를 인식하는 방법, 다른 플랫폼에서 동일한 사용자를 인식하는 방법 등 많은 요구사항이 있습니다. 스마트 컨트랙트에 "메모리"를 저장하는 방법은 무엇인가요? 각각 AI 에이전트가 있는 여러 디바이스가 있는 경우 메모리를 어떻게 공유하나요?
웹3.0에서 해왔던 '체인 상의 데이터', 체인 상의 관계, DID, P2P 네트워크 등이 새로운 의미와 시나리오를 갖게 된다는 것을 알게 될 것입니다.
결론
21년 전 제가 AI와 블록체인에 대해 강연했던 결론을 반복하며 To AI, 몇 마디 말씀드리고 싶습니다. 인간에게 더 친근한 인터넷은 인간에게도 더 친근한 인터넷입니다. 당시만 해도 공상에 불과했지만 이제 미래가 다가왔습니다.