Tác giả: Haotian
Một số bạn cho biết sự suy giảm liên tục của các mục tiêu của Web3 AI Agent như #ai16z và $arc là do giao thức MCP mới phổ biến gần đây? Lần đầu tiên nghe thấy, tôi hơi bối rối. WTF thì có liên quan gì chứ? Nhưng sau khi suy nghĩ kỹ, tôi thấy rằng thực sự có một logic nhất định: logic định giá và định giá của Web3 AI Agent hiện tại đã thay đổi và hướng tường thuật cũng như lộ trình đưa sản phẩm đến tay người dùng cần phải được điều chỉnh gấp. Dưới đây là ý kiến cá nhân của tôi:
1) MCP (Model Context Protocol) là một giao thức chuẩn hóa nguồn mở được thiết kế để cho phép nhiều AI LLM/Agent kết nối liền mạch với nhiều nguồn dữ liệu và công cụ khác nhau. Nó tương đương với giao diện USB "phổ quát" cắm và chạy, thay thế phương pháp đóng gói "cụ thể" đầu cuối trước đây.
Nói một cách đơn giản, có những đảo dữ liệu rõ ràng giữa các ứng dụng AI. Để Agent/LLM có thể giao tiếp với nhau, chúng cần phát triển các giao diện API tương ứng. Không chỉ các quy trình vận hành phức tạp mà chúng còn thiếu các chức năng tương tác hai chiều và thường có quyền truy cập mô hình và hạn chế cấp phép tương đối hạn chế.
Sự xuất hiện của MCP cung cấp một khuôn khổ thống nhất cho phép các ứng dụng AI thoát khỏi trạng thái đảo dữ liệu trong quá khứ và hiện thực hóa khả năng truy cập "động" vào dữ liệu và công cụ bên ngoài. Nó có thể giảm đáng kể độ phức tạp của quá trình phát triển và hiệu quả tích hợp, cũng như về mặt thực hiện tác vụ tự động, truy vấn dữ liệu thời gian thực và cộng tác đa nền tảng. Lúc này, nhiều người đã nghĩ ngay đến việc nếu chúng ta sử dụng công nghệ cộng tác đa tác nhân Manus để tích hợp nền tảng nguồn mở MCP có thể thúc đẩy cộng tác đa tác nhân này thì liệu có bất khả chiến bại không?
Đúng vậy, Manus + MCP chính là chìa khóa cho tác động mà web3 AI Agent đã phải chịu đựng lần này.
2) Tuy nhiên, điều đáng kinh ngạc là cả Manus và MCP đều là các khuôn khổ và tiêu chuẩn giao thức cho web2 LLM/Agent, giải quyết vấn đề tương tác dữ liệu và cộng tác giữa các máy chủ tập trung. Quyền và quyền kiểm soát truy cập của chúng cũng dựa vào việc mở "chủ động" của từng nút máy chủ. Nói cách khác, nó chỉ là một thuộc tính công cụ nguồn mở.
Về mặt logic, điều này hoàn toàn trái ngược với những ý tưởng cốt lõi của web3 AI Agent, chẳng hạn như "máy chủ phân tán, cộng tác phân tán, khuyến khích phân tán", v.v. Làm sao một khẩu pháo Ý tập trung có thể thổi bay một boongke phi tập trung?
Lý do là giai đoạn đầu tiên của web3 AI Agent quá "web2-ized". Một mặt, nhiều nhóm đến từ nền tảng web2 và không hiểu đầy đủ về nhu cầu gốc của web3 Native. Ví dụ, khuôn khổ ElizaOS ban đầu là một khuôn khổ đóng gói giúp các nhà phát triển triển khai nhanh chóng các ứng dụng AI Agent. Nó tích hợp các nền tảng như Twitter và Discord và một số giao diện API như OpenAI, Claude và DeepSeek, và đóng gói một cách thích hợp một số khuôn khổ chung của Memory và Charter để giúp các nhà phát triển nhanh chóng phát triển và triển khai các ứng dụng AI Agent. Nhưng nếu nói một cách chính xác thì sự khác biệt giữa khuôn khổ dịch vụ này và các công cụ nguồn mở của web2 là gì? Những lợi thế khác biệt là gì?
Vậy thì lợi thế ở đây là có một bộ các ưu đãi của Tokenomics phải không? Sau đó sử dụng một khuôn khổ có thể được thay thế hoàn toàn bằng web2 để khuyến khích một nhóm các tác nhân AI hiện có phát hành các đồng tiền mới? tệ hại. . Theo logic này, bạn sẽ hiểu sơ bộ tại sao Manus + MCP có thể tác động đến Web3 AI Agent? Do một số khuôn khổ và dịch vụ web3 AI Agent chỉ giải quyết được nhu cầu phát triển và ứng dụng nhanh tương tự như web2 AI Agent, nhưng không thể theo kịp tốc độ đổi mới của web2 về dịch vụ kỹ thuật, tiêu chuẩn và lợi thế khác biệt, nên thị trường/vốn đã đánh giá lại và định giá lại đợt web3 AI Agent trước đó.
3) Nói như vậy thì cốt lõi của vấn đề đã được tìm ra, nhưng làm thế nào để phá vỡ bế tắc? Chỉ có một cách: tập trung vào các giải pháp web3 gốc, vì hoạt động và kiến trúc khuyến khích của các hệ thống phân tán là những lợi thế khác biệt tuyệt đối của web3?
Lấy sức mạnh điện toán đám mây phân tán, dữ liệu, thuật toán và các nền tảng dịch vụ khác làm ví dụ. Trên bề mặt, có vẻ như loại sức mạnh điện toán và dữ liệu này được tổng hợp bằng các nguồn lực nhàn rỗi không thể đáp ứng được nhu cầu đổi mới kỹ thuật trong ngắn hạn. Tuy nhiên, khi một số lượng lớn các LLM AI đang cạnh tranh trong cuộc chạy đua vũ trang về sức mạnh điện toán tập trung để đạt được đột phá về hiệu suất, thì một mô hình dịch vụ với "nguồn lực nhàn rỗi, chi phí thấp" như một mánh lới quảng cáo tất nhiên sẽ bị các nhà phát triển web2 và nhóm VC coi thường.
Tuy nhiên, một khi Web2 AI Agent đã vượt qua giai đoạn cạnh tranh về đổi mới hiệu suất, nó chắc chắn sẽ theo đuổi các hướng như mở rộng kịch bản ứng dụng theo chiều dọc và tối ưu hóa mô hình tinh chỉnh phân đoạn. Chỉ khi đó, lợi thế của dịch vụ tài nguyên Web3 AI mới thực sự được bộc lộ. Trên thực tế, khi web2 AI đã leo lên vị trí của một gã khổng lồ bằng cách độc quyền tài nguyên, đạt đến một giai đoạn nhất định, sẽ rất khó để rút lui và sử dụng ý tưởng bao vây thành phố từ nông thôn để đột phá từng kịch bản được chia nhỏ. Vào thời điểm đó, đã đến lúc các nhà phát triển web2 AI dư thừa + tài nguyên web3 AI cùng nhau làm việc.
Do đó, không gian cơ hội cho Web3 AI Agent hiện rất rõ ràng: trước khi nền tảng tài nguyên web3 AI tràn ngập nhu cầu của khách hàng là nhà phát triển web2, hãy khám phá và triển khai một tập hợp các giải pháp và con đường khả thi không thể đạt được nếu không có kiến trúc phân tán web3. Trên thực tế, ngoài việc triển khai nhanh + khuôn khổ giao tiếp cộng tác đa tác nhân + câu chuyện phát hành tiền Tokenom của web2, web3 AI Agent còn có nhiều hướng đổi mới của web3 Native đáng để khám phá:
Ví dụ, được trang bị khuôn khổ cộng tác đồng thuận phân tán, xét đến các đặc điểm của điện toán ngoài chuỗi mô hình lớn LLM + lưu trữ trạng thái trên chuỗi, cần có nhiều thành phần thích ứng.
1. Mua lại và xác minh dữ liệu ngoài chuỗi. Độ chắc chắn của trạng thái cơ sở kiến thức khi tác nhân AI đang chạy và quá trình lý luận cũng tương đối tạm thời, một tập hợp các thư viện trạng thái chính và các đường dẫn lý luận phía sau LLM cần được ghi lại và lưu trữ trong hệ thống lưu trữ phân tán và cơ chế chứng minh dữ liệu được kiểm soát chi phí được cung cấp để đảm bảo dữ liệu trong quá trình xác minh chuỗi công khai; 4. Một lớp điện toán riêng tư ZKP không có kiến thức, có thể liên kết các giải pháp điện toán riêng tư bao gồm TEE và FHE, thực hiện điện toán riêng tư theo thời gian thực + xác minh bằng chứng dữ liệu, để Agent có thể có nhiều nguồn dữ liệu theo chiều dọc hơn (y tế, tài chính), sau đó các Agent dịch vụ chuyên nghiệp và tùy chỉnh hơn sẽ xuất hiện ở trên cùng; 5. Một giao thức khả năng tương tác chuỗi chéo, có phần giống với khuôn khổ do giao thức nguồn mở MCP xác định. Sự khác biệt là bộ giải pháp Khả năng tương tác này yêu cầu cơ chế lập lịch chuyển tiếp và giao tiếp thích ứng với hoạt động, truyền tải và xác minh của Agent và có thể hoàn tất việc chuyển giao tài sản và đồng bộ hóa trạng thái của Agent giữa các chuỗi khác nhau, đặc biệt là các trạng thái phức tạp bao gồm ngữ cảnh Agent và Promopt, cơ sở kiến thức, Bộ nhớ, v.v.; Theo tôi, chìa khóa để chinh phục Agent AI web3 thực sự phải là làm thế nào để làm cho "quy trình làm việc phức tạp" của AI Agent và "luồng xác minh độ tin cậy" của blockchain phù hợp nhất có thể. Đối với các giải pháp gia tăng này, có thể chúng được nâng cấp và lặp lại từ các dự án tường thuật hiện có hoặc được tạo mới từ các dự án trong hướng tường thuật AI Agent mới thành lập.
Đây chính là hướng mà web3 AI Agent nên nỗ lực xây dựng và phù hợp với các nguyên tắc cơ bản của hệ sinh thái đổi mới theo cốt truyện vĩ mô của AI + Crypto. Nếu không có sự đổi mới và phát triển phù hợp cũng như việc thiết lập các rào cản cạnh tranh khác biệt thì mọi sự xáo trộn trong đường hướng AI web2 đều có thể khiến AI web3 bị đảo lộn.