저자: LINDABELL 출처: ChainFeeds
2022년 OpenAI는 GPT-3.5 모델을 기반으로 한 ChatGPT를 출시했으며, 이후 인공지능에 대한 AI 내러티브의 물결이 이어지고 있습니다. 그러나 ChatGPT는 대부분의 경우 문제를 효과적으로 처리할 수 있지만, 도메인별 지식이나 실시간 데이터가 필요한 경우 성능이 제한될 수 있습니다. 예를 들어, 지난 18개월 동안 비탈릭 부테린의 토큰 거래 내역에 대한 질문을 받았을 때 신뢰할 수 있고 자세한 정보를 제공하지 못했습니다. 이에 더그래프의 핵심 개발팀인 세미오틱 랩스는 더그래프 인덱싱 스택과 OpenAI를 결합하여 사용자에게 암호화폐 시장 동향 분석과 거래 데이터 조회를 제공하는 프로젝트인 에이전트c>를 만들었습니다.
대리인이 비탈릭 부테린의 지난 18개월 동안 토큰 거래 내역에 대해 질문했을 때 거래 내역에 대한 질문을 받았을 때 더 자세한 답변을 제공했습니다. 그러나 The Graph의 AI 레이아웃은 여기서 멈추지 않습니다. 백서 "AI 인프라로서의 더 그래프"에서는 특정 애플리케이션을 출시하는 것이 아니라 탈중앙화 데이터 인덱싱 프로토콜로서의 강점을 활용하여 개발자에게 웹3 기반 AI 애플리케이션 구축에 필요한 도구를 제공하는 것이 목표라고 밝히고 있습니다. . 또한 이러한 목표를 지원하기 위해 세미오틱 랩스는 에이전트 코드베이스를 오픈소스화하여 개발자들이 NFT 시장 동향 분석 에이전트, 디파이 트레이딩 보조 에이전트와 같이 에이전트와 유사한 기능을 갖춘 AI 디앱을 만들 수 있도록 지원하고 있습니다.
그래프 탈중앙화 AI 로드맵
2018년 7월에 출시된 The Graph는 블록체인 데이터 색인 및 쿼리를 위한 탈중앙화 프로토콜입니다. 개발자는 이 프로토콜을 통해 오픈 API를 사용하여 서브그래프라는 데이터 인덱스를 생성하고 게시하여 애플리케이션이 온체인 데이터를 효율적으로 검색할 수 있도록 지원합니다. 현재까지 더그래프는 50개 이상의 체인을 지원하고, 75,000개 이상의 프로젝트를 호스팅하며, 1조 2,600억 건 이상의 쿼리를 처리했습니다.
The Graph가 이렇게 많은 양의 데이터를 처리할 수 있는 것은 Edge & Node, Streamingfast, Semiotic, The Guild, GraphOps, Messari, Pinax 등 핵심 팀이 있었기에 가능했습니다. 스트리밍패스트는 블록체인 데이터 스트리밍을 위한 크로스체인 아키텍처 기술을 제공하는 데 주력하고 있으며, 세미오틱 AI는 더 그래프에 AI와 암호화를 적용하는 데 주력하고 있으며, 더 길드, 그래프옵스, 메사리, 피낙스는 각각 그래프QL 개발, 인덱싱 서비스, 서브그래프 개발, 데이터 스트리밍 솔루션 등의 분야에 전문성을 갖추고 있습니다. 그래프옵스, 메사리, 피낙스는 각각 그래프QL 개발, 인덱싱 서비스, 서브그래프 개발, 데이터 흐름 솔루션을 전문으로 합니다.
그래프의 AI 레이아웃은 새로운 아이디어가 아닙니다. 작년 3월, The Graph 블로그에서는 데이터 인덱싱 기능을 활용한 AI 애플리케이션의 잠재력을 설명하는 기사를 게시한 바 있습니다. 작년 12월, The Graph는 대규모 언어 모델을 위한 AI 지원 쿼리를 추가할 계획이 담긴 '새로운 시대'라는 새로운 로드맵을 발표했습니다. 최근 백서를 발표하면서 AI 로드맵이 더욱 명확해졌습니다. 이 백서에서는 개발자가 앱의 프런트엔드에 직접 AI 기능을 통합할 수 있는 추론 및 에이전트 서비스의 두 가지 AI 서비스를 소개하며, 전체 프로세스는 더 그래프가 지원합니다.
추론 서비스: 광범위한 오픈 소스 AI 모델 지원
기존 추론 서비스에서 모델은 중앙화된 클라우드 컴퓨팅 리소스를 통해 입력 데이터에 대한 예측을 수행합니다. 예측합니다. 예를 들어 ChatGPT에 질문을 하면 추론하여 답변을 반환합니다. 그러나 이러한 중앙화된 접근 방식은 비용을 증가시킬 뿐만 아니라 검열의 위험도 수반하는데, 더 그래프는 dApp 개발자가 AI 모델을 배포하고 호스팅하는 데 있어 보다 유연성을 제공하는 탈중앙화된 모델 호스팅 마켓플레이스를 구축함으로써 이러한 문제를 해결하고자 합니다.
The Graph는 백서에서 파캐스터 사용자가 자신의 게시물이 좋아요를 많이 받을 수 있는지 여부를 파악할 수 있는 앱을 만드는 방법을 예로 들었습니다. 먼저, The Graph의 하위 그래프 데이터 서비스를 사용하여 Farcaster 게시물의 댓글 수와 좋아요 수를 색인화합니다. 다음으로, 신경망을 훈련시켜 새로운 파캐스터의 댓글이 좋아요를 받을지 예측하고, 신경망을 The Graph의 추론 서비스에 배포했습니다. 이렇게 탄생한 디앱은 사용자가 더 많은 좋아요를 받는 게시물을 작성할 수 있도록 도와줍니다.
이 접근 방식은 개발자가 사전 학습된 모델을 The Graph 네트워크에서 호스팅하고 API 인터페이스를 통해 앱에 통합하여 사용자가 dApp을 사용할 때 이러한 기능을 직접 경험할 수 있도록 함으로써 The Graph의 인프라를 쉽게 활용할 수 있도록 합니다.
개발자에게 더 많은 선택권과 유연성을 제공하기 위해 The Graph의 추론 서비스는 사용 가능한 대부분의 인기 모델을 지원합니다. 백서에는 "MVP 단계에서 The Graph의 추론 서비스는 Stable Diffusion, Stable Video Diffusion, LLaMA, Mixtral, Grok, Whisper 등 인기 있는 오픈 소스 AI 모델을 선별하여 지원할 것입니다."라고 적혀 있습니다. 앞으로 충분한 테스트와 인덱서 운영을 거친 모든 오픈 모델은 그래프 추론 서비스에 배포할 수 있습니다. 또한, 더 그래프는 AI 모델 배포의 기술적 복잡성을 줄이기 위해 프로세스를 간소화하는 사용자 친화적인 인터페이스를 제공하여 개발자가 인프라 유지 관리에 대한 걱정 없이 손쉽게 AI 모델을 업로드하고 관리할 수 있도록 지원합니다.
특정 애플리케이션 시나리오에서 모델 성능을 더욱 향상시키기 위해 The Graph는 특정 데이터 세트에 대한 모델 미세 조정도 지원합니다. 그러나 미세 조정은 일반적으로 The Graph에서 수행되지 않는다는 점에 유의해야 합니다. 개발자는 외부에서 모델을 미세 조정한 다음 The Graph의 추론 서비스를 사용하여 배포해야 합니다. 그리고 개발자들이 미세 조정된 모델을 공개적으로 사용하도록 장려하기 위해, The Graph는 모델 제작자와 모델을 제공하는 인덱서 간에 쿼리 비용을 적절히 배분하는 등의 인센티브를 제공하기 위해 노력하고 있습니다.
추론 작업의 실행을 검증하는 측면에서 The Graph는 신뢰할 수 있는 기관, M-of-N 합의, 대화형 사기 증명, zk-SNARK와 같은 여러 접근 방식을 제공하며, 각 방식에는 고유한 장단점이 있는데, 신뢰할 수 있는 기관은 신뢰할 수 있는 기관에 의존하고, M-of-N 합의는 여러 인덱서를 필요로 합니다. M-of-N 합의는 여러 인덱서가 검증해야 하므로 부정 행위의 난이도가 높아지고 계산 및 조정 비용도 증가하며, 대화형 사기 증명은 더 안전하지만 빠른 응답이 필요한 애플리케이션에는 적합하지 않으며, zk-SNARK는 구현이 더 복잡하고 대규모 모델에는 적합하지 않습니다.
The Graph는 개발자와 사용자가 자신의 필요에 맞는 보안 수준을 선택할 수 있어야 한다고 믿습니다. 따라서 The Graph는 추론 서비스에서 다양한 보안 요구 사항과 애플리케이션 시나리오를 수용하기 위해 여러 가지 검증 방법을 지원할 계획입니다. 예를 들어, 금융 거래나 중요한 비즈니스 로직과 관련된 상황에서는 zk-SNARK 또는 M-of-N 합의와 같은 더 높은 수준의 보안 인증 방법을 사용해야 할 수 있습니다. 위험도가 낮거나 엔터테인먼트 중심의 애플리케이션의 경우, 신뢰할 수 있는 기관 또는 대화형 사기 증명과 같이 비용이 저렴하고 구현이 간단한 인증 방법을 선호할 수 있습니다. 또한, 더 그래프는 모델 및 사용자 개인정보 보호 문제를 개선하기 위해 개인정보 보호 강화 기술을 연구할 계획입니다.
에이전트 서비스: 개발자가 자율적인 AI 기반 앱을 구축하도록 지원
추론을 위해 학습된 AI 모델을 실행하는 데 초점을 맞춘 추론 서비스와 달리 에이전트 서비스는 더 복잡합니다. 에이전트 서비스는 여러 구성 요소가 함께 작동하여 에이전트가 복잡하고 자동화된 다양한 작업을 수행할 수 있도록 해야 하므로 더 복잡합니다. The Graph의 에이전트 서비스 가치 제안은 에이전트의 구축, 호스팅 및 실행을 The Graph에 통합하고 인덱서 네트워크에서 제공합니다.
특히, The Graph는 에이전트 구축과 호스팅을 지원하는 분산형 네트워크를 제공합니다. 에이전트가 The Graph 네트워크에 배포되면, The Graph 인덱서는 데이터 색인, 체인 이벤트 응답 및 기타 상호 작용 요청을 포함하여 필요한 실행 지원을 제공합니다.
위에서 언급했듯이 The Graph 개발의 핵심 팀인 Semiotic Labs는 초기 에이전트 실험인 Agentc를 출시했습니다. The Graph의 인덱싱 소프트웨어 스택과 OpenAI를 결합한 에이전트는 자연어 입력을 SQL 쿼리로 변환하여 사용자가 블록체인의 실시간 데이터를 직접 쿼리하고 그 결과를 이해하기 쉬운 형식으로 사용자에게 제시하는 데 초점을 맞추고 있습니다. 간단히 말해 에이전트씨는 사용자에게 편리한 암호화폐 시장 동향 분석과 거래 데이터 조회를 제공하는 데 중점을 두고 있으며, 모든 데이터는 유니스왑 V2, 유니스왑 V3, 유니스왑 X 및 이더의 포크에서 제공되며 가격은 매시간 업데이트됩니다.
또한 더 그래프에서 사용하는 LLM 모델의 정확도가 63.41%에 불과해 잘못된 응답이 발생할 수 있다고 밝혔습니다. 이 문제를 해결하기 위해 The Graph는 KGLLM(Knowledge Graph 지원 대규모 언어 모델)이라는 새로운 대규모 언어 모델을 개발 중입니다.
KGLLM은 각 진술이 인체인 타임스탬프와 투표 검증으로 뒷받침되는 시스템인 Geo에서 제공하는 구조화된 지식 그래프 데이터를 사용하여 잘못된 정보가 생성될 확률을 크게 줄입니다. 지오의 지식 그래프를 통합하면 의료 규정, 정치 상황, 시장 분석 등 다양한 시나리오에 에이전트를 적용할 수 있어 에이전트 서비스의 다양성과 정확성을 높일 수 있습니다. 예를 들어, KGLLM은 정치 데이터를 사용하여 탈중앙화 자율 조직(DAO)에 정책 변화에 대한 조언을 제공함으로써 최신의 정확한 정보에 기반하도록 보장할 수 있습니다.
KGLLM의 강점은 다음과 같습니다.
구조화된 데이터 사용: KGLLM은 구조화된 외부 지식 베이스를 사용합니다. 정보는 지식 그래프에서 그래픽으로 모델링되어 데이터 간의 관계를 쉽게 파악할 수 있으므로 데이터를 쿼리하고 이해하는 것이 더욱 직관적입니다.
관계형 데이터 처리 기능: KGLLM은 특히 관계형 데이터를 처리하는 데 매우 적합합니다. 예를 들어 사람과 사람 사이의 관계, 사람과 이벤트 사이의 관계 등을 이해할 수 있습니다. 또한 그래프 탐색 알고리즘을 사용하여 지식 그래프에서 여러 노드를 이동하여 관련 정보를 찾습니다(지도에서 이동하는 것과 유사). 이러한 방식으로 KGLLM은 질문에 대한 답변에 가장 관련성이 높은 정보를 찾을 수 있습니다.
효율적인 정보 검색 및 생성: 그래프 탐색 알고리즘을 통해 KGLLM이 추출한 관계는 자연어로 변환되어 모델이 이해할 수 있는 명확한 단서로 변환됩니다. 단서, 그리고 이러한 명확한 지침을 통해 KGLLM 모델은 보다 정확하고 관련성 높은 응답을 생성할 수 있습니다.
전망
더그래프는 '웹3.0의 구글'로서의 강점을 살려 현재 AI 서비스의 데이터 부족을 보완하고 개발자의 프로젝트 개발을 간소화하는 AI 서비스를 도입할 예정입니다. 서비스를 도입해 개발자의 프로젝트 개발 과정을 간소화합니다. 더 많은 AI 애플리케이션이 개발되고 사용됨에 따라 사용자 경험은 더욱 향상될 것으로 기대됩니다. 앞으로도 더 그래프 개발팀은 AI와 Web3의 결합 가능성을 지속적으로 모색할 예정입니다. 또한 Playgrounds Analytics, DappLooker 등 생태계의 다른 팀들도 프록시 서비스와 관련된 솔루션을 설계하고 있습니다.