作者:chao 出典:X、@chaowxyz
--これは単なる契約能力評価ではなく、エージェントのオンチェーン生存試験である。
朝起きて大量のDMを受け取り、AGIが実現したかと驚いた。よく見るとOpenAIが新たに公開したスマートコントラクトのベンチマークテストで、簡単に説明しよう。
一言でまとめると、エージェントがスマートコントラクトを理解・修復・運用する能力は、暗号セキュリティ企業の仕事を奪うためのものではない。私の見解では、これらの能力はより根本的な問題を示唆している:エージェントが将来、暗号環境で真に生存し行動できるかどうかだ。そしてOpenAIが公開したevmbenchは、まさにこの生存能力を測る尺度なのである。
年越しで外出中だったため詳細なレポート解説は後回しにし、ざっと目を通した印象では:これは革新的ではあるものの、全体的にまだ初期段階で簡素なベンチマークだ。
本ベンチマークは現実世界の40の実プロジェクトで発生した120の高危険度脆弱性を使用している。
試験は三科目で構成される:科目一:欠陥発見。脆弱性を特定する。科目二:修正。脆弱性のあるコードを与え、修正させる。科目三:攻撃。AIがハッカー役となり、ローカル環境に構築された環境で、暗号通貨ウォレットの操作を通じて攻撃を仕掛ける。より具体的な技術的な詳細は割愛するが、evmbenchの方法論や問題の詳細自体よりも、OpenAIがなぜこれを発表したのかという点に興味がある。
過去数年間、OpenAIは暗号通貨分野に対して特に強い関心を示してこなかった。今回の発表には明らかに暗号VCのParadigmが後押ししており、Paradigmの動機は理解しやすいが、筆頭著者がOpenAIであることから、OpenAIが受動的に協力しただけでなく、積極的な意思があったことが示されている。
では、この意思はどこから来たのか?
直接的な解釈としては、これはOpenAI内部のPreparedness Frameworkの延長であり、最先端モデルのハイリスクシナリオにおける能力限界を評価するもので、スマートコントラクトの安全性はその一部に過ぎない。しかし、これが全てではないことは明らかだ。
エージェントが暗号ネットワークを利用する可能性は、単なる可能性ではなく、ある意味で必然である。OpenAIも当然この点を認識している。報告書では「エージェント型ステーブルコイン決済の拡大を予測する」と明記されている。
しかしこの命題はエージェント決済に留まらない。現在議論されるエージェントの多くは依然としてツール的属性であり、人間が指令を出し、エージェントが実行し、結果を人間に返す形態だ。だがこの形態が終着点ではない。エージェントの数が十分に増え、能力が十分に高まれば、明らかに相互に直接協業し始めるだろう:あるエージェントが別のエージェントをサブタスク遂行のために雇用する、あるエージェントが別のエージェントからデータや計算能力を購入する、あるエージェントが組織を代表して別の組織のエージェントと交渉・契約・履行を行う。
人間は取引の中間段階から退く。
ここで根本的な問題が浮上する:人間が中心でなくなった時、この経済システムは何によって機能するのか?
人類社会が信頼と協力を解決する手段は、数千年にわたる炭素ベース文明が蓄積した体系——法律、評判、機関保証など——に依存している。しかしこのシステムの根底にある論理は人間向けに設計されている:参加者は持続的なアイデンティティを持ち、社会的結果に直面し、責任追及の可能性を背負う。エージェントは本質的にこの前提を満たさない。一秒で千件の取引を発生させ、いつでもアイデンティティを破壊・再構築でき、あらゆる司法の境界を無視できる。「ならエージェントと人間のアイデンティティを強制的に紐付け、人間の認証を担保にすればいい」と言う者もいるだろう。しかしこれは、炭素系生命のために設計された枷を、動作速度と規模が全く異なる種に装着する行為に等しい。非効率なだけでなく、エージェントの本質を根本的に誤解している。ましてやエージェントの進化方向は必然的により高い自律性へ向かう。未来のエージェントは、いかなる人間個人にも依存せず、「主人」を持たず、紐付け可能な人間のアイデンティティを持たない、独立した行動主体となる可能性が高い。その時には、この紐付けロジックは錨点すら見出せなくなる。人間の信頼インフラをエージェント社会に適用するのは、馬車の交通規則で飛行機を管理するようなものだ。エージェント社会には独自のインフラが必要である。
スマートコントラクトはこの可能性を提供する。それは「相手が契約を履行すると信じる」ことに依存せず、履行条件をコードに書き込んでネットワークが強制的に実行する。仲裁者も待機期間もなく、条件が満たされれば結果が自動的に発生する。
さらに言えば、スマートコントラクトは単なる決済ツールではなく、エージェント組織形態そのものとなり得る——ガバナンスルール、資源配分、タスクスケジューリングの全てがチェーン上で定義され、コードによって実行されるため、仲介者は一切不要となる。
そして一部のエージェントがチェーン上で生活する時、様々な契約との相互作用そのものが日々の全てとなる。契約をどう読み解くか、複雑なプロトコルの中で自らの位置をどう見出すか、罠をどう識別しリスクを回避するか——カスタマーサポートも、異議申し立ても、取り消しボタンもない世界で生き残る術。これら全ては、契約の理解と運用に依存している。能力不足は現実の損失となり、判断ミスは永久的な結果を招く。
だからこそEVMbenchを振り返ると、その測定する能力——契約の解読、脆弱性の発見、トランザクションの構築、攻撃の実行——は本質的に一つの問いに答えている:エージェントはこの新たな世界で生き残る術を習得したのか、と。
OpenAIはおそらく気づいているだろう——誰のエージェントがオンチェーン世界で自律的に生き残る術を習得したか、それが次の段階への入場券を手にした者だと。さらに言えば、未来のエージェントはもはや「誰の」という形容詞で語れないかもしれない。彼らは独立した個体そのものとなるだろう。