Tác giả: Zeke, Nhà nghiên cứu của YBB Capital
1. Thói quen thích cái mới và ghét cái cũ bắt đầu chú ý
< p style="text-align: left;">Trong năm qua, do sự gián đoạn của tường thuật lớp ứng dụng và không thể bắt kịp tốc độ bùng nổ cơ sở hạ tầng, lĩnh vực mã hóa dần trở thành một trò chơi để thu hút sự chú ý. Từ Silly Dragon đến Goat, từ Pump.fun đến Clanker, cuộc chiến giành sự chú ý ngày càng gay gắt. Bắt đầu với nhận thức bắt mắt sáo rỗng nhất, nó nhanh chóng chuyển sang mô hình nền tảng trong đó người yêu cầu và người cung cấp sự chú ý được thống nhất, sau đó các sinh vật dựa trên silicon trở thành nhà cung cấp nội dung mới. Trong số các nhà cung cấp Meme Coin kỳ lạ khác nhau, cuối cùng cũng có một sự tồn tại có thể cho phép các nhà đầu tư bán lẻ và VC đạt được sự đồng thuận: AI Agent.

Sự chú ý cuối cùng là một trò chơi có tổng bằng 0, nhưng sự đầu cơ thực sự có thể khiến mọi thứ tăng trưởng chóng mặt. Trong bài viết về UNI, chúng tôi đã xem xét sự khởi đầu của kỷ nguyên vàng cuối cùng của blockchain. Lý do cho sự phát triển nhanh chóng của DeFi bắt nguồn từ kỷ nguyên khai thác LP được bắt đầu bởi Composite Finance, được thực hiện trong nhiều nhóm khai thác khác nhau với hàng nghìn hoặc thậm chí hàng chục. của hàng nghìn Apy. Vào và ra là cách chơi trò chơi nguyên thủy nhất trên chuỗi trong thời kỳ đó, mặc dù tình huống cuối cùng là nhiều nhóm khai thác khác nhau bị sập và phủ đầy lông vũ. Tuy nhiên, làn sóng khai thác vàng điên cuồng đã thực sự để lại tính thanh khoản chưa từng có trong blockchain. DeFi cuối cùng đã thoát khỏi hoạt động đầu cơ thuần túy và hình thành một hướng đi trưởng thành, đáp ứng nhu cầu tài chính của người dùng về mọi mặt như thanh toán, giao dịch, chênh lệch giá và đặt cược. Đặc vụ AI cũng đang trải qua giai đoạn man rợ này ở giai đoạn này. Điều chúng tôi đang khám phá là làm thế nào Crypto có thể tích hợp AI tốt hơn và cuối cùng đẩy lớp ứng dụng lên một tầm cao mới.
2. Làm thế nào để một tác nhân trở nên tự chủ
Chúng tôi đã giới thiệu ngắn gọn về nó trong bài viết trước Về nguồn gốc của AI Meme: Truth Terminal và triển vọng về tương lai của AI Agent, bài viết này trước hết tập trung vào chính AI Agent.
Hãy bắt đầu với định nghĩa về Tác nhân AI là một thuật ngữ cũ hơn nhưng được định nghĩa không rõ ràng trong lĩnh vực AI. Điểm nhấn chính của nó là Tự trị (Tự chủ), nghĩa là. nghĩa là, bất kỳ AI nào có thể nhận biết môi trường và tạo ra phản xạ đều có thể được gọi là tác nhân. Theo định nghĩa ngày nay, AI Agent gần hơn với một tác nhân thông minh, tức là thiết lập một hệ thống cho một mô hình lớn để bắt chước quá trình ra quyết định của con người. Trong giới học thuật, hệ thống này được coi là hướng đi hứa hẹn nhất đối với AGI (Trí tuệ nhân tạo tổng hợp). .
Ở phiên bản GPT đầu tiên, rõ ràng chúng ta có thể nhận thấy rằng mô hình lớn rất giống con người, nhưng khi trả lời nhiều câu hỏi phức tạp, mô hình lớn chỉ có thể đưa ra Một số câu trả lời hợp lý. Nguyên nhân cơ bản là mô hình lớn lúc đó dựa trên xác suất chứ không phải quan hệ nhân quả. Thứ hai, nó thiếu khả năng sử dụng công cụ, trí nhớ, lập kế hoạch, v.v. và AI Agent có thể bù đắp cho những thiếu sót này. Vì vậy hãy sử dụng công thức để tóm tắt, AI Agent (tác nhân thông minh) = LLM (mô hình lớn) + Lập kế hoạch (lập kế hoạch) + Bộ nhớ (bộ nhớ) + Công cụ (công cụ).

Mô hình lớn dựa trên các từ nhắc nhở (Prompt) giống một người tĩnh hơn. Nó chỉ trở nên sống động khi chúng ta nhập nó và mục tiêu của tác nhân thông minh là một người thực hơn. . Các tác nhân thông minh hiện tại trong vòng tròn chủ yếu là các mô hình được tinh chỉnh dựa trên phiên bản Llama 70b hoặc 405b mã nguồn mở của Meta (cả hai đều có các tham số khác nhau). Chúng có khả năng ghi nhớ và sử dụng các công cụ truy cập API, nhưng có thể cần sự trợ giúp hoặc đầu vào của con người. ở các khía cạnh khác (Bao gồm cả sự tương tác và cộng tác với các tác nhân khác), nên chúng ta có thể thấy các tác nhân chính trong vòng tròn ngày nay vẫn tồn tại trên mạng xã hội dưới dạng KOLs. Để làm cho một tác nhân thông minh giống con người hơn, nó cần có khả năng lập kế hoạch và hành động, đồng thời chuỗi tư duy phụ trong việc lập kế hoạch là đặc biệt quan trọng.
3. Chuỗi suy nghĩ (CoT)
Chuỗi suy nghĩ (CoT) Khái niệm của Tư duy (CoT) lần đầu tiên xuất hiện trong bài báo “Chuỗi tư duy thúc đẩy suy luận bằng ngôn ngữ lớn” do Google xuất bản vào năm 2022. Models”, bài viết chỉ ra rằng khả năng suy luận của mô hình có thể được nâng cao bằng cách tạo ra một loạt các bước suy luận trung gian, giúp mô hình hiểu rõ hơn và giải quyết các vấn đề phức tạp.

Một Lời nhắc CoT điển hình bao gồm ba phần: Hướng dẫn rõ ràng, mô tả nhiệm vụ, cơ sở logic, cơ sở lý thuyết hoặc nguyên tắc hỗ trợ giải pháp nhiệm vụ, ví dụ về các giải pháp cụ thể và trình diễn cách tiếp cận có cấu trúc này. Dựa trên sự hiểu biết của mô hình về yêu cầu nhiệm vụ, mô hình sẽ dần dần tiếp cận câu trả lời thông qua suy luận logic, từ đó nâng cao hiệu quả và độ chính xác của việc giải quyết vấn đề. CoT đặc biệt phù hợp với các nhiệm vụ yêu cầu phân tích chuyên sâu và lý luận nhiều bước, chẳng hạn như giải bài toán, viết báo cáo dự án và các nhiệm vụ đơn giản khác có thể không mang lại lợi thế rõ ràng, nhưng đối với các nhiệm vụ phức tạp, nó có thể cải thiện đáng kể hiệu suất. của mô hình, thông qua các chiến lược Giải quyết từng bước giúp giảm tỷ lệ lỗi và nâng cao chất lượng hoàn thành nhiệm vụ.
Khi xây dựng AI Agent, CoT đóng vai trò quan trọng. AI Agent cần hiểu thông tin nhận được và đưa ra quyết định hợp lý dựa trên thông tin đó. tư duy giúp Tác nhân xử lý và phân tích thông tin đầu vào một cách hiệu quả, đồng thời chuyển kết quả phân tích thành các hướng dẫn hành động cụ thể. Phương pháp này không chỉ nâng cao độ tin cậy và hiệu quả trong việc ra quyết định của Tác nhân mà còn cải thiện tính minh bạch của quá trình ra quyết định và đưa ra quyết định. hành vi của Tác nhân dễ dự đoán và theo dõi hơn. Bằng cách phân tách các nhiệm vụ thành nhiều bước nhỏ, nó giúp Đại lý xem xét cẩn thận từng điểm quyết định và giảm bớt các quyết định sai lầm do quá tải thông tin, khiến quá trình ra quyết định của Đại lý trở nên minh bạch hơn và giúp người dùng dễ hiểu hơn về cơ sở đưa ra quyết định của Đại lý. -làm. Khi tương tác với môi trường, CoT cho phép Tác nhân liên tục tìm hiểu thông tin mới và điều chỉnh các chiến lược hành vi.
Là một chiến lược hiệu quả, CoT không chỉ cải thiện khả năng suy luận của các mô hình ngôn ngữ lớn mà còn đóng vai trò quan trọng trong việc xây dựng các Tác nhân AI thông minh và đáng tin cậy hơn. Bằng cách tận dụng CoT, các nhà nghiên cứu và nhà phát triển có thể tạo ra các hệ thống thông minh có khả năng thích ứng tốt hơn với các môi trường phức tạp và có mức độ tự chủ cao. CoT đã chứng minh những ưu điểm độc đáo của nó trong các ứng dụng thực tế, đặc biệt là khi xử lý các nhiệm vụ phức tạp bằng cách phân tách nhiệm vụ thành một loạt các bước nhỏ, nó không chỉ cải thiện độ chính xác của việc giải quyết nhiệm vụ mà còn nâng cao khả năng diễn giải và khả năng kiểm soát của mô hình. . Cách tiếp cận từng bước này để giải quyết vấn đề có thể làm giảm đáng kể các quyết định sai lầm do thông tin quá nhiều hoặc quá phức tạp gây ra khi đối mặt với các nhiệm vụ phức tạp. Đồng thời, cách tiếp cận này cũng cải thiện khả năng truy xuất nguồn gốc và kiểm chứng của toàn bộ giải pháp.
Chức năng cốt lõi của CoT là kết hợp lập kế hoạch, hành động và quan sát để thu hẹp khoảng cách giữa lý luận và hành động. Chế độ tư duy này cho phép Tác nhân AI đưa ra các biện pháp đối phó hiệu quả khi dự đoán các tình huống bất thường mà nó có thể gặp phải, cũng như tích lũy thông tin mới khi tương tác với môi trường bên ngoài, xác minh các dự đoán đã đặt trước và đưa ra cơ sở lý luận mới. CoT giống như một công cụ ổn định và chính xác mạnh mẽ giúp Tác nhân AI duy trì hiệu quả làm việc hiệu quả trong môi trường phức tạp.
Bốn. Đúng các yêu cầu giả
Những khía cạnh nào của ngăn xếp công nghệ AI thực hiện Cần tiền điện tử? Để kết hợp? Trong bài viết năm ngoái, tôi tin rằng việc phân cấp sức mạnh tính toán và dữ liệu là một bước quan trọng để giúp các doanh nghiệp nhỏ và nhà phát triển cá nhân tiết kiệm chi phí. Trong chương trình phân khúc Crypto x AI năm nay do Coinbase tổ chức, chúng tôi đã thấy sự phân chia chi tiết hơn. /p>
(1) Lớp điện toán (đề cập đến mạng tập trung vào việc cung cấp tài nguyên bộ xử lý đồ họa (GPU) cho các nhà phát triển AI);
(2) Lớp dữ liệu (đề cập đến mạng hỗ trợ truy cập phi tập trung, điều phối và xác minh các đường dẫn dữ liệu AI);
(3) Lớp phần mềm trung gian (Đề cập đến nền tảng hoặc mạng hỗ trợ phát triển, triển khai và lưu trữ các mô hình hoặc tác nhân AI);
(4) Lớp ứng dụng (đề cập đến việc sử dụng cơ chế AI trên chuỗi) Các sản phẩm hướng đến người dùng, cho dù là B2B hay B2C).
Trong bốn lớp phân chia này, mỗi lớp có một tầm nhìn lớn. Tóm lại, mục tiêu của nó là chống lại làn sóng tiếp theo của những gã khổng lồ ở Thung lũng Silicon thống trị Internet. thời đại. Như tôi đã nói năm ngoái, chúng ta có thực sự phải chấp nhận sự kiểm soát độc quyền về sức mạnh tính toán và dữ liệu của những gã khổng lồ ở Thung lũng Silicon không? Mô hình lớn nguồn đóng dưới sự độc quyền của họ là một chiếc hộp đen bên trong. Khoa học là tôn giáo phổ biến nhất của nhân loại ngày nay. Trong tương lai, mọi câu trả lời của mô hình lớn sẽ được đông đảo mọi người coi là sự thật, nhưng điều này. sự thật nên làm thế nào để xác minh? Theo tầm nhìn của những gã khổng lồ ở Thung lũng Silicon, các tác nhân thông minh cuối cùng sẽ có những quyền ngoài sức tưởng tượng, chẳng hạn như quyền thanh toán bằng ví của bạn và quyền sử dụng thiết bị đầu cuối. Làm thế nào để đảm bảo rằng mọi người không có ý đồ xấu?
Phi tập trung là câu trả lời duy nhất, nhưng đôi khi chúng ta có cần xem xét một cách hợp lý một cách toàn diện không, có bao nhiêu người mua cho những tầm nhìn lớn này? Trước đây, chúng ta có thể sử dụng Token để bù đắp những lỗi do lý tưởng hóa gây ra mà không tính đến các vòng khép kín thương mại. Tình hình ngày nay rất nghiêm trọng và Crypto x AI cần được thiết kế dựa trên tình hình thực tế. Ví dụ, làm thế nào để hai đầu của lớp sức mạnh tính toán có thể cân bằng khi hiệu suất bị mất và không ổn định? Để phù hợp với khả năng cạnh tranh của đám mây tập trung. Sẽ có bao nhiêu người dùng thực trong dự án lớp dữ liệu? Làm cách nào để xác minh tính hợp lệ thực sự của dữ liệu được cung cấp? Điều tương tự cũng áp dụng cho hai cấp độ còn lại. Trong thời đại này, chúng ta không cần quá nhiều nhu cầu giả có vẻ đúng.
5. Meme chạy trốn khỏi SocialFi
Như tôi đã nói ở đoạn đầu Meme có đã sử dụng một phương pháp siêu nhanh để phát triển biểu mẫu SocialFi tương thích với Web3. Friend.tech là Dapp đầu tiên ra mắt vòng ứng dụng xã hội này, nhưng nó đã bị đánh bại bởi thiết kế Token háo hức. Pump.fun đã xác minh tính khả thi của một nền tảng thuần túy không có bất kỳ mã thông báo hoặc quy tắc nào. Người yêu cầu và nhà cung cấp sự chú ý là thống nhất. Bạn có thể đăng meme, phát sóng trực tiếp, phát hành tiền xu, để lại tin nhắn và giao dịch trên nền tảng. Mọi thứ đều miễn phí. Điều này về cơ bản phù hợp với mô hình kinh tế chú ý của các mạng xã hội như YouTube và Instagram ngày nay, ngoại trừ việc đối tượng sạc khác nhau và lối chơi của Pupm.fun giống Web3 hơn.

Clanker của Base là bậc thầy về tất cả những điều đó. Nhờ hệ sinh thái tích hợp do hệ sinh thái đích thân quản lý, Base có Dapp xã hội của riêng mình như một công cụ hỗ trợ để hình thành một vòng khép kín nội bộ hoàn chỉnh. Meme thông minh là dạng 2.0 của Meme Coin Mọi người luôn tìm kiếm những ý tưởng mới và Pump.fun hiện đang đi đầu. Đánh giá theo xu hướng, việc những ý tưởng ngẫu nhiên của các sinh vật dựa trên silicon thay thế chỉ còn là vấn đề thời gian. những meme thô tục về các sinh vật dựa trên carbon.
Tôi đã đề cập đến Base không biết bao nhiêu lần, nhưng nội dung đề cập mỗi lần đều khác nhau. Theo dòng thời gian, Base chưa bao giờ là người dẫn đầu, nhưng mỗi lần đều khác nhau. nó luôn là người chiến thắng.
6. Tác nhân thông minh có thể là gì khác?
Từ quan điểm thực dụng, các tác nhân không thể được phân cấp trong thời gian dài trong tương lai Dựa trên việc xây dựng các tác nhân trong AI truyền thống. field, Hãy nhìn xem, đây không phải là vấn đề có thể được giải quyết bằng cách phân cấp quy trình lý luận và nguồn mở. Nó yêu cầu quyền truy cập vào nhiều API khác nhau để truy cập nội dung Web2. Chi phí vận hành của nó rất tốn kém. của nhiều tác nhân thường Hoặc dựa vào con người làm phương tiện. Chúng ta sẽ trải qua một giai đoạn chuyển tiếp dài cho đến khi xuất hiện một hình thức tích hợp phù hợp, có lẽ giống như UNI. Nhưng giống như bài viết trước, tôi vẫn nghĩ rằng các tác nhân thông minh sẽ có tác động lớn đến ngành của chúng ta, giống như sự tồn tại của Cex trong ngành của chúng ta, điều này không chính xác nhưng quan trọng.
Bài viết "Tổng quan về tác nhân AI" do Stanford và Microsoft phát hành tháng trước mô tả rộng rãi về ứng dụng của tác nhân thông minh trong ngành y tế, máy móc thông minh và thế giới ảo. world. Trong phần phụ lục của bài viết này, có rất nhiều trường hợp thử nghiệm trong đó GPT-4V đã được sử dụng làm tác nhân để tham gia phát triển các trò chơi 3A hàng đầu.
Không cần phải nhấn mạnh quá nhiều vào tốc độ kết hợp với phân cấp. Tôi hy vọng rằng câu đố đầu tiên mà tác nhân có thể hoàn thành là khả năng và tốc độ. từ dưới lên. Chúng tôi có rất nhiều tàn tích tường thuật và siêu dữ liệu trống cần được điền vào. Ở giai đoạn thích hợp, chúng tôi sẽ xem xét cách biến nó thành UNI tiếp theo.