著者:jolestar出典:X, @jolestar
先週、私はAIエージェントに目を通し、その前日には北京で開催されたai16zのイベントに参加し、AIエージェントが今実際に何ができるのかを見てきました。私は、AIエージェントが今実際に何ができるかを見て、将来何ができるかを考えたかったのです。
AIエージェントの現状は、中に人が隠れている自動販売機のイメージを思い出させます。私たちは皆、AIエージェントが自律的に動き始めていると想像していますが、実際にはAIエージェントの中に開発者が隠れているのです。
AIエージェントフレームワークは現在、クライアント(Twitter、Discord、Telegramなど)とさまざまなプラグイン(チェーンなど)をまとめる接着剤の役割を果たし、次にフレームワークが基本ライブラリ(メモリストレージ、セッション分離、コンテキスト生成など)を提供します。そして、フレームワークはベース・ライブラリー(メモリー・ストレージ、セッション分離、コンテキスト生成)などを提供し、様々なAIプラットフォームへのインターフェースを提供する。
AIエージェント フレームワークとアプリケーションやビジネスシナリオの組み合わせ方
昨年のAI爆発以降。昨年のAI爆発以降、さまざまなプラットフォームやツールが登場していますが、重要なのは、AIをどのようにアプリケーションと組み合わせられるかという問題を解決することです。プラグイン・アプローチを提供しようとするAIプラットフォームもあれば、ワークフローモデルを構築するもの、AIのアプリケーションに従来のアプリケーションを組み込むものもある。しかし、ここで重要なのは、1.アプリケーションのインタラクションの入り口はどこか、2.既存のビジネスロジックとAIをどのように組み合わせるか、である。
すべてのAIプラットフォームは、アプリのインタラクションの入り口として、チャットウィンドウのようなダイアログボックスをユーザーに提供しており、AIアプリとのインタラクションは「ヒューマノイド」であるべきだと誰もが同意していることは明らかだ。AIエージェントは、すべてのオープンなIMやソーシャル・システムに直接プラグインするという点でスマートであり、新しいものよりもはるかに受け入れられやすい。
AIは既存のビジネスロジックにどのように適合するのか? AIエージェントは、開発者がAIによる判断をビジネスシナリオに組み込むことができるソリューションを提供します。プログラミング言語は決定論的である必要があり、if条件はtrueかfalseでなければならないため、ファジーなビジネスロジックを扱うことはできません。AIを使えば、複雑なロジックを正確な条件に変換し、ビジネスシナリオにシームレスに統合することができます。
たとえば、グループ内のメッセージに返信するには、従来のIMボットでは、何らかの明示的なメッセージコマンドによってトリガーされる必要がありましたが、AIでは、コンテキストが与えられれば、trueまたはfalseを返すshouldReplyMessageメソッドを実装できます。style="text-align: left;">ビジネスロジックのシナリオにおけるAIの役割は主に次のとおりです:
1.「意図」の発見: プロンプトの言葉を通して
2.意思決定支援:AIはあいまいで複雑な条件を、決定論的な真偽値または列挙型に変換し、ビジネスロジックに組み込むことができます。
これを見て、多くの人はAIエージェントに失望するかもしれません。多くの人は、AIがAIにすべてを教えるだけのAIエージェントだと思っています。現実には、大規模なモデルには文脈上の制約があるため、何でもできる万能のAIを作る方法は(少なくとも現時点では)存在しない。しかし、良いニュースは、プログラマーが職を失う心配がないということです。AIの陰に隠れているプログラマーはまだたくさんいますし、他のもしものために誰かが重ねる必要性はまだありますが、重要な違いは、プログラムが扱えるビジネスの境界が広がっているということです。
2種類AIエージェント
イベントで、@shawmakesmagicさんに質問されました。1.AIエージェントはそれ自体が役割を果たし、独自のID、ブランドを持ち、ユーザーにサービスを提供する。2.ユーザーは個人的なAIエージェントを持ち、個人的なアシスタントに相当し、ユーザーがビジネスの一部に対処するのを助けることができる。この2つのAIエージェントのうち、どちらが普及するだろうか?彼は、どちらの方向性も良いと考えており、それらを組み合わせることも可能だと考えている。
第一の方向性は、人々が主に市場で模索しているものです。
この方向性は、サービスAIエージェントに似ており、将来的にはアプリのインターフェイスはなく、アプリはAIエージェントであり、擬人化されるかもしれません。アプリケーションのローカルデータはエージェントのメモリの一部となり、プラグインはクラウド上のサービス・エージェントとの通信も担当します。そして、これはインフラ全体を変える新しいアプリケーション・アーキテクチャ・モデルです。
AIエージェント インフラストラクチャの要件
1.インフラストラクチャはアクセスフリーでなければなりません。パーミッションレス)でなければならず、そうでなければAIエージェントは様々な反攻撃戦略によって制限され、サービスは方法(ガス)の反攻撃の経済的コストを使用する必要があります。この時点で、オープンでないプラットフォームは大きな衝撃に直面し、Web2初期のオープンプラットフォーム熱が再燃するだろう。
2.AIエージェントは、上記の問題を解決するための資金を持ちながら活動する必要がある。
つまり、ブロックチェーンベースであろうとなかろうと、将来のサービスはCryptoの秘密鍵モデルの認証とCryptoベースの支払いをサポートする必要がある。
AIエージェント チェーンとの組み合わせ
上記の2点に加え、AIエージェントとチェーンをどのように組み合わせるかという問題が検討されています。チェーンの組み合わせは、人々が模索している方向性です。このイベントで、@Mikkke_accと、同社が取り組んでいるfocElizaプロジェクトについて話していたのですが、上記の2つのAI Agentのうち、少なくとも最初のAI Agentは、チェーンが提供するランタイムや検証環境を必要とします。というのも、ひとたびAIエージェントが公衆にサービスを提供すれば、そこには信頼の問題が発生し、実際にはスマートコントラクトと同じ役割を果たすからだ。
その昔、「スマート・コントラクト」という名称について論争がありました。単なるコードの断片なのに、どこに「スマートさ」があるのか、AIはその名にふさわしいスマート・コントラクトを作ることができる。課題は、スマート・コントラクト環境でAIのインターフェースをどのように呼び出すかだ。検証可能な環境で大きなモデルを動かすには長い道のりだとすれば、オラクルのようなソリューションがより現実的な道だ。
AIエージェントの周辺には多くの要件があります:AIエージェントはどのように公開知識を得るのか、AIエージェントはどのように事実を判断するのか、AIエージェントはどのように異なるプラットフォームで同じユーザーを認識するのか、AIエージェントはどのように異なるプラットフォームで同じユーザーを認識するのか、AIエージェントはどのように異なるプラットフォームで同じユーザーを認識するのか、AIエージェントはどのように異なるプラットフォームで同じユーザーを認識するのか、AIエージェントはどのように異なるプラットフォームで同じユーザーを認識するのか、AIエージェントはどのように異なるプラットフォームで同じユーザーを認識するのか。スマートコントラクトの "メモリー "はどのように保存するのですか?複数のデバイスがあり、それぞれにAIエージェントがいる場合、どのようにメモリを共有するのですか?
Web3で行ってきた「チェーン上のデータ」「チェーン上の関係」「DID」「P2Pネットワーク」などが、新しい意味とシナリオを持っていることがわかるでしょう。
結論
私が21年前にAIとブロックチェーンについて行った講演の結論の繰り返しになりますが、AIへ、一言申し上げたいと思います。>AIよりフレンドリーなインターネットは、人間にとってもよりフレンドリーなインターネットです。当時はただの思いつきでしたが、今は未来がここにあります。