المؤلف: زيكي، باحث YBB Capital
1. تبدأ عادة الإعجاب بالجديد وكره القديم مع الاهتمام
< p style="text-align: left;">في العام الماضي، وبسبب انقطاع سرد طبقة التطبيق وعدم القدرة على مجاراة سرعة انفجار البنية التحتية، تحول مجال التشفير تدريجيًا إلى لعبة لموارد الاهتمام. من التنين السخيف إلى الماعز، ومن Pump.fun إلى Clanker، اشتدت معركة جذب الانتباه. بدءاً من الإدراك الأكثر ابتذالاً ولفتاً للنظر، سرعان ما تغير إلى نموذج منصة حيث تم توحيد طالبي الاهتمام ومقدمي الاهتمام، وبعد ذلك أصبحت الكائنات الحية القائمة على السيليكون مقدمة جديدة للمحتوى. من بين مختلف شركات النقل الغريبة لعملة Meme Coin، هناك أخيرًا وجود يمكن أن يسمح لمستثمري التجزئة ورأس المال الاستثماري بالتوصل إلى إجماع: وكيل الذكاء الاصطناعي.
الانتباه هو في نهاية المطاف لعبة محصلتها صفر، لكن المضاربة يمكن أن تدفع الأمور بالفعل إلى النمو الجامح. في مقالتنا عن UNI، استعرضنا بداية العصر الذهبي الأخير لـ blockchain. نشأ سبب النمو السريع لـ DeFi من عصر تعدين LP الذي بدأ بواسطة Compound Finance، والذي تم تنفيذه في مجمعات التعدين المختلفة بالآلاف أو حتى العشرات. كانت لعبة In and out هي الطريقة الأكثر بدائية للعب على السلسلة خلال تلك الفترة، على الرغم من أن الوضع النهائي كان انهيار مجمعات التعدين المختلفة وتغطيتها بالريش. ومع ذلك، فإن التدفق المجنون لعمال مناجم الذهب قد ترك بالفعل سيولة غير مسبوقة في blockchain. لقد انفصلت DeFi أخيرًا عن المضاربة البحتة وشكلت مسارًا ناضجًا، مما يرضي المستخدمين في جميع الجوانب مثل الدفع والتداول والمراجحة والاحتياجات المالية. يمر AI Agent أيضًا بهذه المرحلة الوحشية في هذه المرحلة، وما نستكشفه هو كيف يمكن لـ Crypto دمج الذكاء الاصطناعي بشكل أفضل ودفع طبقة التطبيق في النهاية إلى آفاق جديدة.
2. كيف يصبح الوكيل مستقلاً
لقد قدمناه باختصار في المقالة السابقة فيما يتعلق بأصل AI Meme: Truth Terminal، والنظرة المستقبلية لـ AI Agent، تركز هذه المقالة أولاً على AI Agent نفسه.
لنبدأ بتعريف وكيل الذكاء الاصطناعي وهو مصطلح أقدم ولكن غير محدد بشكل واضح في مجال الذكاء الاصطناعي أي أن أي ذكاء اصطناعي يمكنه إدراك البيئة وإحداث انعكاسات يمكن أن يُطلق عليه اسم "الوكيل". في تعريف اليوم، يعد AI Agent أقرب إلى الوكيل الذكي، أي إنشاء نظام لنموذج كبير لتقليد عملية صنع القرار البشرية، ويعتبر هذا النظام أكثر الطرق الواعدة للذكاء الاصطناعي العام. .
في إصدار GPT المبكر، كان بإمكاننا أن ندرك بوضوح أن النموذج الكبير كان يشبه الإنسان جدًا، ولكن عند الإجابة على العديد من الأسئلة المعقدة، لم يكن بإمكان النموذج الكبير إلا أن يعطي بعض الإجابات المعقولة. السبب الأساسي هو أن النموذج الكبير في ذلك الوقت كان يعتمد على الاحتمالية وليس السببية. ثانيًا، كان يفتقر إلى قدرة البشر على استخدام الأدوات والذاكرة والتخطيط وما إلى ذلك، ويمكن لعامل الذكاء الاصطناعي تعويض هذه النواقص. لذا استخدم صيغة للتلخيص، وكيل الذكاء الاصطناعي (الوكيل الذكي) = LLM (نموذج كبير) + التخطيط (التخطيط) + الذاكرة (الذاكرة) + الأدوات (الأدوات).
النموذج الكبير القائم على الكلمات السريعة (موجه) يشبه إلى حد كبير شخصًا ثابتًا، ولا ينبض بالحياة إلا عندما ندخله، ويكون هدف الوكيل الذكي شخصًا أكثر واقعية . الوكلاء الأذكياء اليوم في الدائرة هم في الأساس نماذج دقيقة تعتمد على إصدار Llama 70b أو 405b مفتوح المصدر من Meta (كلاهما لهما معلمات مختلفة) ولديهما القدرة على تذكر واستخدام أدوات الوصول إلى واجهة برمجة التطبيقات، ولكن قد يتطلبان مساعدة بشرية أو مدخلات أخرى (بما في ذلك التفاعل والتعاون مع الوكلاء الآخرين)، لذلك يمكننا أن نرى أن الوكلاء الرئيسيين في الدائرة اليوم لا يزالون موجودين على الشبكات الاجتماعية في شكل KOLs. ولجعل الوكيل الذكي أكثر شبهاً بالإنسان، فإنه يحتاج إلى الوصول إلى قدرات التخطيط والعمل، وسلسلة التفكير الفرعي في التخطيط أمر بالغ الأهمية بشكل خاص.
3. سلسلة الأفكار (CoT)
سلسلة الأفكار (CoT) المفهوم ظهر مفهوم الفكر (CoT) لأول مرة في ورقة بحثية بعنوان "سلسلة الأفكار تثير التفكير بلغة كبيرة" والتي نشرتها جوجل في عام 2022. "النماذج"، تشير الورقة إلى أنه يمكن تعزيز القدرة الاستدلالية للنموذج من خلال توليد سلسلة من خطوات الاستدلال الوسيطة، مما يساعد النموذج على فهم المشكلات المعقدة وحلها بشكل أفضل.
يتكون موجه CoT النموذجي من ثلاثة أجزاء: تعليمات واضحة، ووصف المهمة، والأساس المنطقي، والأساس النظري أو المبادئ لدعم حل المهمة، وأمثلة لحلول محددة، وعرض لهذا النهج المنظم. واستناداً إلى فهم النموذج لمتطلبات المهمة، فإنه يقترب تدريجياً من الإجابة من خلال التفكير المنطقي، وبالتالي تحسين كفاءة ودقة حل المشكلات. يعتبر CoT مناسبًا بشكل خاص للمهام التي تتطلب تحليلًا متعمقًا واستدلالًا متعدد الخطوات، مثل حل المشكلات الرياضية وكتابة تقرير المشروع والمهام البسيطة الأخرى. قد لا يحقق CoT مزايا واضحة، ولكن بالنسبة للمهام المعقدة، يمكنه تحسين الأداء بشكل كبير النموذج، من خلال استراتيجيات الحل خطوة بخطوة تقلل من معدلات الخطأ وتحسن جودة إنجاز المهام.
عند إنشاء وكيل الذكاء الاصطناعي، يلعب CoT دورًا رئيسيًا ويحتاج إلى فهم المعلومات المستلمة واتخاذ قرارات معقولة بناءً عليها يساعد التفكير الوكيل على معالجة المعلومات المدخلة وتحليلها بشكل فعال، وتحويل نتائج التحليل إلى إرشادات عمل محددة. ولا تعمل هذه الطريقة على تعزيز موثوقية وكفاءة عملية صنع القرار لدى الوكيل فحسب، بل تعمل أيضًا على تحسين شفافية عملية صنع القرار. سلوك الوكيل أكثر قابلية للتنبؤ به ويمكن تتبعه من خلال تحليل المهام إلى عدة خطوات صغيرة، فإنه يساعد الوكيل على النظر بعناية في كل نقطة قرار وتقليل القرارات غير الصحيحة الناجمة عن التحميل الزائد للمعلومات، مما يجعل عملية اتخاذ القرار لدى الوكيل أكثر شفافية ويسهل على المستخدمين فهم أساس قرار الوكيل. -تحضير. في التفاعل مع البيئة، يسمح CoT للوكيل بالتعلم المستمر للمعلومات الجديدة وتعديل الاستراتيجيات السلوكية.
باعتبارها إستراتيجية فعالة، لا تعمل CoT على تحسين القدرات المنطقية لنماذج اللغات الكبيرة فحسب، بل تلعب أيضًا دورًا مهمًا في بناء وكلاء الذكاء الاصطناعي الأكثر ذكاءً وموثوقية. من خلال الاستفادة من CoT، يمكن للباحثين والمطورين إنشاء أنظمة ذكية أكثر قدرة على التكيف مع البيئات المعقدة وتتمتع بدرجة عالية من الاستقلالية. لقد أثبت CoT مزاياه الفريدة في التطبيقات العملية، خاصة عند التعامل مع المهام المعقدة. من خلال تحليل المهمة إلى سلسلة من الخطوات الصغيرة، فإنه لا يحسن دقة حل المهام فحسب، بل يعزز أيضًا إمكانية التفسير والتحكم في النموذج . يمكن لهذا النهج التدريجي لحل المشكلات أن يقلل بشكل كبير من القرارات الخاطئة الناتجة عن المعلومات الكثيرة أو المعقدة جدًا عند مواجهة المهام المعقدة. وفي الوقت نفسه، يعمل هذا النهج أيضًا على تحسين إمكانية التتبع والتحقق من الحل بأكمله.
تتمثل الوظيفة الأساسية لـ CoT في الجمع بين التخطيط والعمل والملاحظة لسد الفجوة بين التفكير والفعل. يسمح وضع التفكير هذا لوكلاء الذكاء الاصطناعي بصياغة تدابير مضادة فعالة عند التنبؤ بالمواقف غير الطبيعية التي قد يواجهونها، بالإضافة إلى تجميع معلومات جديدة أثناء التفاعل مع البيئة الخارجية، والتحقق من التنبؤات المحددة مسبقًا، وتوفير أساس تفكير جديد. يشبه CoT محركًا قويًا للدقة والاستقرار يساعد وكلاء الذكاء الاصطناعي في الحفاظ على كفاءة العمل الفعالة في البيئات المعقدة.
أربعة. تصحيح المتطلبات الزائفة
ما هي جوانب مكدس تكنولوجيا الذكاء الاصطناعي؟ هل تحتاج إلى التشفير؟ في مقال العام الماضي، اعتقدت أن اللامركزية في قوة الحوسبة والبيانات كانت خطوة أساسية لمساعدة الشركات الصغيرة والمطورين الأفراد على توفير التكاليف. في المسار المجزأ Crypto x AI لهذا العام الذي نظمته Coinbase، رأينا تقسيمًا أكثر تفصيلاً:< /p>
(1) طبقة الحوسبة (في إشارة إلى الشبكة التي تركز على توفير موارد وحدة معالجة الرسومات (GPU) لمطوري الذكاء الاصطناعي)؛
(2) طبقة البيانات (في إشارة إلى الشبكة التي تدعم الوصول اللامركزي والتنسيق والتحقق من خطوط أنابيب بيانات الذكاء الاصطناعي)؛
(3) طبقة البرامج الوسيطة (بالإشارة إلى النظام الأساسي أو الشبكة التي تدعم تطوير ونشر واستضافة نماذج أو وكلاء الذكاء الاصطناعي)؛
(4) طبقة التطبيق (بالإشارة إلى استخدام آليات الذكاء الاصطناعي على السلسلة) المنتجات الموجهة للمستخدم، سواء كانت B2B أو B2C).
في طبقات التقسيم الأربع هذه، كل طبقة لديها رؤية عظيمة باختصار، تتمثل أهدافها في محاربة الموجة التالية من عمالقة وادي السيليكون الذين يهيمنون على الإنترنت. عصر. وكما قلت في العام الماضي، هل يتعين علينا حقاً أن نقبل السيطرة الحصرية على قوة الحوسبة والبيانات من قِبَل عمالقة وادي السيليكون؟ النموذج الكبير مغلق المصدر تحت احتكارهم هو صندوق أسود بداخله. العلم هو الدين الأكثر شعبية للبشرية اليوم. في المستقبل، سيتم اعتبار كل جملة يجيب عليها النموذج الكبير حقيقة من قبل عدد كبير من الناس، ولكن هذا ينبغي الحقيقة كيفية التحقق؟ وفقاً لرؤية عمالقة وادي السيليكون، سيحصل العملاء الأذكياء في نهاية المطاف على أذونات تفوق الخيال، مثل الحق في الدفع في محفظتك والحق في استخدام الأجهزة الطرفية. كيف نضمن عدم وجود نوايا شريرة لدى الناس؟
اللامركزية هي الحل الوحيد، لكن في بعض الأحيان نحتاج إلى التفكير بشكل معقول بشكل شامل، كم عدد المشترين لهذه الرؤى الكبرى؟ في الماضي، كان بإمكاننا استخدام الرمز المميز للتعويض عن الأخطاء الناجمة عن المثالية دون النظر إلى الحلقات التجارية المغلقة. الوضع اليوم خطير للغاية، ويجب تصميم Crypto x AI بناءً على الوضع الفعلي، على سبيل المثال، كيف يمكن موازنة طرفي طبقة الطاقة الحاسوبية عندما يكون الأداء مفقودًا وغير مستقر؟ لتتناسب مع القدرة التنافسية للسحابة المركزية. كم عدد المستخدمين الحقيقيين في مشروع طبقة البيانات؟ كيف يمكن التحقق من صحة البيانات المقدمة؟ ما نوع العملاء الذين يحتاجون إلى هذه البيانات؟ وينطبق الشيء نفسه على المستويين الآخرين، في هذا العصر، لا نحتاج إلى الكثير من الاحتياجات الزائفة التي تبدو صحيحة.
5. هربت Meme من SocialFi
كما قلت في الفقرة الأولى، لقد هربت Meme استخدم طريقة فائقة السرعة لتطوير نموذج SocialFi المتوافق مع Web3. كان Friend.tech هو أول تطبيق Dapp يطلق هذه الجولة من التطبيقات الاجتماعية، لكنه هُزم بسبب تصميم الرمز المميز المتحمس. لقد تحققت Pump.fun من جدوى وجود منصة خالصة دون أي رموز أو قواعد. تم توحيد المطالبين وموردي الاهتمام، حيث يمكنك نشر الميمات وإجراء البث المباشر وإصدار العملات المعدنية وترك الرسائل والتداول على المنصة. كل شيء مجاني. يتوافق هذا بشكل أساسي مع نموذج اقتصاد الانتباه لوسائل التواصل الاجتماعي مثل YouTube وInstagram اليوم، باستثناء أن كائنات الشحن مختلفة، وطريقة اللعب في Pupm.fun هي أكثر Web3.
يعد Base's Clanker سيدًا في كل شيء، بفضل البيئة المتكاملة التي تديرها البيئة شخصيًا، تمتلك Base تطبيق Dapp الاجتماعي الخاص بها كمساعدة لتشكيل حلقة مغلقة داخلية كاملة. Intelligent Meme هو الإصدار 2.0 من Meme Coin. يبحث الناس دائمًا عن أفكار جديدة، وأصبح Pump.fun الآن في المقدمة. انطلاقًا من هذا الاتجاه، فهي مسألة وقت فقط قبل أن تحل الأفكار العشوائية للكائنات القائمة على السيليكون الميمات المبتذلة للكائنات الحية القائمة على الكربون.
لقد ذكرت Base للمرة الألف، لكن محتوى الإشارة يختلف في كل مرة عن الجدول الزمني، ولم تكن Base هي المحرك الأول أبدًا، ولكن إنه الفائز دائمًا.
6. ماذا يمكن أن يكون الوكيل الذكي أيضًا؟
من وجهة نظر عملية، من المستحيل أن يظل الوكلاء لامركزيين لفترة طويلة في المستقبل بناءً على بناء الوكلاء في الذكاء الاصطناعي التقليدي انظر، إنها ليست مشكلة يمكن حلها بمجرد تحقيق اللامركزية في عملية التفكير والمصدر المفتوح. إنها تتطلب الوصول إلى واجهات برمجة التطبيقات المختلفة للوصول إلى محتوى Web2، كما أن تكلفة تشغيلها مكلفة للغاية عادةً ما يعتمد العاملون المتعددون على الإنسان كوسيط. سوف نمر بفترة انتقالية طويلة حتى يظهر نموذج التكامل المناسب، ربما مثل UNI. لكن مثل المقال الأخير، ما زلت أعتقد أن الوكلاء الأذكياء سيكون لهم تأثير كبير على صناعتنا، تمامًا مثل وجود Cex في صناعتنا، وهو أمر غير صحيح ولكنه مهم.
يصف المقال "نظرة عامة على وكيل الذكاء الاصطناعي" الصادر عن جامعة ستانفورد ومايكروسوفت الشهر الماضي بشكل موسع تطبيق الوكلاء الأذكياء في الصناعة الطبية، والآلات الذكية، والواقع الافتراضي يوجد في ملحق هذه المقالة العديد من حالات الاختبار التي تم فيها استخدام GPT-4V كعامل للمشاركة في تطوير أفضل ألعاب 3A.
ليست هناك حاجة للإصرار كثيرًا على سرعة دمجها مع اللامركزية، وآمل أن يكون اللغز الأول الذي يمكن للوكيل إكماله هو القدرة والسرعة من الأسفل إلى الأعلى، هناك الكثير من الآثار السردية والتحولات الفارغة التي يجب ملؤها. وفي المرحلة المناسبة، سننظر في كيفية جعلها UNI التالية. ص>