المؤلف |: Frank-Zhang.eth، Twitter: @dvzhangtz

يعتقد المؤلف أن يمثل الذكاء الاصطناعي في حد ذاته نوعًا جديدًا من الإنتاجية وهو اتجاه التنمية البشرية، والجمع بين Web3 وA سيجعل من Web3 علاقة إنتاج جديدة في العصر الجديد، وطريقًا للخلاص لتنظيم المجتمع البشري المستقبلي وتجنب الاحتكار المطلق؛ عمالقة الذكاء الاصطناعي.
باعتباري مستثمرًا في الخطوط الأمامية على المدى الطويل في Web3 وباحثًا سابقًا في الذكاء الاصطناعي، أعتقد أنه من واجبي كتابة مقالة عن رسم خرائط المسار.

1. أهداف هذه المقالة
لكي نفهم "أ" بشكل أكمل، نحتاج لفهم:< /p>
1. بعض المفاهيم الأساسية لـ A مثل: ما هو التعلم الآلي ولماذا هناك حاجة إلى نموذج لغة كبير.
2. ما هي خطوات تطوير الذكاء الاصطناعي مثل الحصول على البيانات، والتدريب المسبق للنموذج، والضبط الدقيق للنموذج، واستخدام النموذج؟
3. بعض الاتجاهات الناشئة مثل: قاعدة المعرفة الخارجية، والتعلم الموحد، وZKML، وFHEML، والتعلم السريع، والخلايا العصبية القادرة.
4. ما هي المشاريع المقابلة لـ Web3 في السلسلة A بأكملها؟
5. فيما يتعلق بسلسلة الذكاء الاصطناعي بأكملها، ما هي الروابط التي لها قيمة أكبر أو عرضة للمشاريع الكبيرة.
عند وصف هذه المفاهيم، سيحاول المؤلف عدم استخدام الصيغ أو التعريفات، بل يستخدم الاستعارات لوصفها.
تغطي هذه المقالة أكبر عدد ممكن من المصطلحات الجديدة ويأمل المؤلف في ترك انطباع لدى القراء إذا واجهوها في المستقبل، فيمكنهم العودة إليها التحقق من هيكل المعرفة الخاصة بهم حيث.
2. المفاهيم الأساسية
الجزء الأول
مشروع web3+ai الذي نعرفه اليوم، تقنيتهم تنتمي إلى التعلم الآلي في الذكاء الاصطناعي الفكرة من الشبكة العصبية.
تحدد الفقرة التالية بشكل أساسي بعض المفاهيم الأساسية: الذكاء الاصطناعي، التعلم الآلي، الشبكة العصبية، التدريب، وظيفة الخسارة، النسب المتدرج، التعلم المعزز، النظام الخبير.
الجزء الثاني
الذكاء الاصطناعي
< p style="text-align: left;">تعريف: الذكاء الاصطناعي هو علم تقني جديد يبحث ويطور النظريات والأساليب والتقنيات وأنظمة التطبيقات التي يمكنها محاكاة الذكاء البشري وتوسيع نطاقه. الغرض من أبحاث الذكاء الاصطناعي هو تعزيز الآلات الذكية التي يمكنها: الاستماع، والرؤية، والتحدث، والتفكير، والتعلم، والتصرف.
تعريفي: النتائج المقدمة بواسطة الآلة والإنسان النتائج المقدمة هي نفسها، ومن الصعب التمييز بين الصواب والخطأ (اختبار تورينج)
الجزء الثالث
النظام الخبير
< p style="text-align: left;">إذا كان هناك شيء له خطوات واضحة ومعرفة مطلوبة: النظام الخبير

الجزء الرابع
إذا كان من الصعب وصف شيء ما، وكيفية القيام بذلك:
1. لديك بيانات توضيحية: التعلم الآلي ، مثل تحليل المشاعر في النص
مثال: بيانات التدريب المطلوبة
سأل صانع المفاتيح أنا: "هل أنت مؤهل؟" "محايد
سألني شياو وانغ القوي جدًا في البيت المجاور: "هل أنت جدير؟" - سلبي
< p style="text-align: left; ">2. لا توجد بيانات مشروحة تقريبًا: التعلم المعزز، مثل لعب الشطرنج

الجزء الخامس
كيف تقوم الشبكات العصبية بتعليم الآلات المعرفة
يتضمن التعلم الآلي الآن نطاقًا واسعًا من المعرفة والنطاق. هنا نناقش فقط الروتين الأكثر كلاسيكية في التعلم الآلي، والشبكات العصبية.
كيف تقوم الشبكة العصبية بتعليم الآلة جزءًا من المعرفة؟ يمكننا مقارنتها بـ:
إذا كنت تريد تعليم جرو كيفية التبول على السجادة (حالة كلاسيكية، لا توجد اتجاهات سيئة) - (إذا كنت تريد تعليم الآلة جزءًا من المعرفة)
الطريقة الأولى: إذا بال الكلب على الحصيرة، كافئ الكلب بقطعة لحم، وإذا لم يكن الكلب موجودًا فاضربه
الطريقة الثانية: إذا بال الكلب على الحصيرة، كافئ الكلب بقطعة لحم، وإذا لم يكن كذلك، فاضربه على مؤخرته؛ وكلما ابتعدت عن الحصيرة، كان الضرب أصعب (احسب الخسارة) وظيفة)
الطريقة الثالثة: في كل مرة يتخذ فيها الكلب خطوة، يتم إصدار الحكم:
p>
إذا كنت تمشي نحو السجادة، فستتم مكافأتك بقطعة لحم. وإذا كنت لا تسير نحو السجادة، فسيتم صفعك p>
(لكل جلسة تدريب، احسب دالة الخسارة)
الطريقة الرابعة: في كل مرة الكلب إذا اتخذ خطوة، فسيتم الحكم
إذا كنت تمشي نحو السجادة، فسوف تتم مكافأتك بقطعة لحم إذا كنت لا تسير نحو السجادة؛ حصيرة
ستضرب;
وضع للكلب قطعة لحم في اتجاه الحصيرة لجذب الكلب للذهاب إلى الحصيرة
(لكل جلسة تدريب، احسب دالة الخسارة، ثم قم بإجراء نزول متدرج في الاتجاه الذي يمكن أن يقلل وظيفة الخسارة بشكل أفضل)

< p style="text-align: left;">
الجزء السادسلماذا حققت الشبكات العصبية تقدمًا سريعًا في السنوات العشر الماضية ?
لأن البشر حققوا تقدمًا سريعًا في قوة الحوسبة والبيانات والخوارزميات في السنوات العشر الماضية.
القوة الحاسوبية: تم اقتراح الشبكات العصبية بالفعل في القرن الماضي، لكن الأجهزة في ذلك الوقت كانت تستغرق وقتًا طويلاً لتشغيل الشبكات العصبية. ومع ذلك، مع تطور تكنولوجيا الرقائق في هذا القرن، تضاعفت القوة الحاسوبية لرقائق الكمبيوتر خلال 18 شهرًا. حتى أن هناك وحدات معالجة الرسومات، وهي شرائح جيدة في الحوسبة المتوازية، مما يجعل الشبكات العصبية "مقبولة" من حيث وقت الحوسبة.
البيانات: تم تجميع وسائل التواصل الاجتماعي وكمية كبيرة من بيانات التدريب على الإنترنت لدى الشركات المصنعة الكبرى أيضًا احتياجات الأتمتة ذات الصلة.
النموذج: بفضل قوة الحوسبة والبيانات، طور الباحثون سلسلة من النماذج الأكثر كفاءة ودقة.
"قوة الحوسبة" و"البيانات" و"النموذج" تسمى أيضًا العناصر الثلاثة للذكاء الاصطناعي.
الجزء السابع
لماذا يعتبر نموذج اللغة الكبير (LLM) ) إنه مهم جدًا
لماذا يجب أن تنتبه: نحن مجتمعون هنا اليوم لأن الجميع مهتمون جدًا بـ Al+ web3 وA مشهور بسبب ChatGPT؛ ينتمي ChatGPT إلى نموذج اللغة الكبير.
لماذا نحتاج إلى نموذج لغة كبير: كما قلنا أعلاه، يتطلب التعلم الآلي بيانات تدريب، لكن تكلفة التعليقات التوضيحية للبيانات واسعة النطاق مرتفعة جدًا؛ يمكن لنموذج اللغة الكبير أن يكون طريقة بارعة لحل هذه المشكلة.

الجزء الثامن
بيرت - أول نموذج للغة الكبيرة
ماذا يجب أن نفعل إذا لم يكن لدينا بيانات التدريب؟ الكلام البشري في حد ذاته هو تعليق توضيحي. يمكننا استخدام cloze لإنشاء البيانات.
يمكننا تفريغ بعض الكلمات في فقرة ما والسماح لنموذج بنية المحولات (غير مهم) بالتنبؤ بالكلمات التي يجب ملؤها في هذه الأماكن ( دع الكلب يجد the mat);
إذا كان توقع النموذج خاطئًا، فاختبر بعض وظائف الخسارة والهبوط المتدرج (إذا سار الكلب نحو الحصيرة، قم بمكافأة قطعة من اللحم، إذا لم يتجه نحو الحصيرة، فاضرب الكلب، ثم ضع قطعة من اللحم في اتجاه الحصيرة لجذب الكلب للذهاب إلى الحصيرة)
بهذه الطريقة، يمكن أن تصبح الفقرات الموجودة على الإنترنت بيانات تدريب. تسمى عملية التدريب هذه أيضًا "التدريب المسبق"، لذلك تسمى نماذج اللغة الكبيرة أيضًا نماذج ما قبل التدريب. يمكن لمثل هذا النموذج أن يعطيه جملة ويطلب منه تخمين الكلمة بكلمة، ما هي الكلمة التي يجب أن تكون التالية. هذه التجربة هي نفسها عندما نستخدم chatgpt الآن.
فهمي للتدريب المسبق: يسمح التدريب المسبق للآلة بتعلم المعرفة الإنسانية الشائعة من المجموعة وتطوير "الإحساس باللغة".

الجزء التاسع
التطوير اللاحق لنماذج اللغة الكبيرة
بعد أن اقترحه بيرت، وجد الجميع أن هذا الشيء سهل الاستخدام حقًا!
طالما أصبح النموذج أكبر حجمًا وأصبحت بيانات التدريب أكثر، فإن سيكون التأثير أنه يمكن أن يتحسن وأفضل. هذا ليس مجرد طائش.
ارتفعت بيانات التدريب بشكل كبير: استخدم بيرت جميع بيانات ويكيبيديا والكتب للتدريب، وفي وقت لاحق، تم توسيع بيانات التدريب لتشمل البيانات الإنجليزية للشبكة بأكملها، وبعد ذلك تم توسيعه ليشمل الشبكة بالكامل
يتزايد عدد معلمات النموذج بسرعة
< img src="https://img .jinse.cn/7219237_image3.png">
3. الخطوات التالية تطوير الذكاء الاصطناعي
الجزء الأول
قبل - الحصول على بيانات التدريب
(لا تتم هذه الخطوة عمومًا إلا من قبل الشركات المصنعة الكبرى/معاهد الأبحاث الكبرى) يتطلب التدريب المسبق عمومًا كمية هائلة من البيانات، الأمر الذي يتطلب الزحف جميع أنواع صفحات الويب عبر الشبكة بالكامل، ويتم قياس التراكم بالتيرابايت ثم تتم معالجة البيانات مسبقًا
التدريب المسبق للنموذج (هذه الخطوة بشكل عام فقط). تم إجراؤه بواسطة الشركات المصنعة/معاهد الأبحاث الكبرى). بعد الانتهاء من جمع البيانات، تم توفير عدد كبير من قوة الحوسبة، ومئات من قوة الحوسبة على مستوى A100/TPU للتدريب المسبق
الجزء الثاني
نموذج التدريب المسبق الثانوي
( الخيار) يسمح التدريب المسبق للآلة بتعلم المعرفة الإنسانية المشتركة من المجموعة وتنمية ""الحس اللغوي"، ولكن إذا أردنا أن يتمتع النموذج بمزيد من المعرفة في مجال معين، فيمكننا أخذ مجموعة هذا المجال وسكبها في نموذج التدريب المسبق الثانوي.
على سبيل المثال، تحتاج شركة Meituan، باعتبارها منصة لتوصيل الطعام، إلى نماذج كبيرة لمعرفة المزيد عن المعرفة المتعلقة بتوصيل الطعام. لذلك، استخدمت Meituan مجموعة الأعمال Meituan-Dianping للتدريب المسبق الثانوي وطورت MT-Bert. النموذج الذي تم الحصول عليه بهذه الطريقة أكثر فعالية في السيناريوهات ذات الصلة.
فهمي للتدريب المسبق الثانوي: التدريب المسبق الثانوي يسمح للنموذج بأن يصبح خبيرًا في سيناريو معين
الجزء 3
نموذج التدريب على الضبط الدقيق
(خيار) إذا كان النموذج الذي تم تدريبه مسبقًا يريد أن يصبح خبيرًا في مهمة معينة، مثل خبير في تصنيف المشاعر، أو خبير في استخلاص الموضوع، أو خبير في التحدث وفهم القراءة؛ فيمكنك استخدام البيانات المتعلقة بالمهمة لضبط النموذج.
ولكن هنا تحتاج إلى تصنيف البيانات. على سبيل المثال، إذا كنت بحاجة إلى بيانات تصنيف المشاعر، فأنت بحاجة إلى بيانات مشابهة لما يلي:
سألني صانع المفاتيح: "هل أنت جدير بالمحايدة؟"
سألني شياو وانغ القوي في البيت المجاور : "هل أنت جدير بالسلبية؟"
فهمي للتدريب المسبق الثانوي: الضبط الدقيق يجعل النموذج خبيرًا في مهمة معينة
تجدر الإشارة إلى أن التدريب النموذجي يتطلب نقل كميات كبيرة من البيانات بين بطاقات الرسومات. حاليًا، يحتوي Al+ web3 الخاص بنا على فئة كبيرة من المشاريع التي توزع قوة الحوسبة - حيث يساهم الأشخاص من جميع أنحاء العالم بآلاتهم الخاملة للقيام بأشياء معينة. ولكن من الصعب جدًا استخدام هذا النوع من قوة الحوسبة لإجراء تدريب مسبق موزع كامل؛ إذا كنت تريد إجراء تدريب دقيق وموزع، فأنت بحاجة أيضًا إلى تصميم ذكي للغاية. لأن وقت نقل المعلومات بين بطاقات الرسومات سيكون أطول من وقت الحساب.
الجزء الرابع
وتجدر الإشارة إلى أن التدريب النموذج يتطلب نقل كمية كبيرة من البيانات بين بطاقات الرسومات. حاليًا، لدينا في Al+web3 فئة كبيرة من المشاريع التي توزع قوة الحوسبة - حيث يساهم الأشخاص من جميع أنحاء العالم بآلاتهم الخاملة للقيام بأشياء معينة. ولكن من الصعب جدًا استخدام هذا النوع من قوة الحوسبة لإجراء تدريب مسبق موزع كامل؛ إذا كنت تريد إجراء تدريب دقيق وموزع، فأنت بحاجة أيضًا إلى تصميم ذكي للغاية. لأن وقت نقل المعلومات بين بطاقات الرسومات سيكون أطول من وقت الحساب.
الجزء الخامس
استخدام النموذج
< p style="text-align: left;">استخدام النموذج، ويسمى أيضًا استدلال النموذج (الاستدلال). يشير هذا إلى عملية استخدام النموذج مرة واحدة بعد تدريبه.
مقارنة بالتدريب، لا يتطلب الاستدلال النموذجي أن تقوم بطاقة الرسومات بنقل كمية كبيرة من البيانات، لذا فإن الاستدلال الموزع يعد مهمة سهلة نسبيًا.
4. أحدث تطبيقات النماذج الكبيرة
الجزء الأول
قاعدة المعرفة الخارجية
سبب حدوثه: نأمل أن يعرف النموذج قدرًا بسيطًا من المعرفة في مجالنا، لكننا لا نريد إنفاق الكثير من المال لإعادة تدريب النموذج
الطريقة: قم بتعبئة كمية كبيرة من بيانات pdf في قاعدة بيانات المتجهات واستخدمها كمعلومات خلفية كمدخلات
الحالة: Baidu Yunduo, Myshell
التعلم السريع
السبب: نشعر أن قاعدة المعرفة الخارجية لا يمكنها تلبية احتياجاتنا لتخصيص النموذج، لكننا لا تريد أن تتحمل عبء النموذج بأكمله. التدريب على تعديل المعلمة
الطريقة: لا تقم بتدريب النموذج، استخدم فقط بيانات التدريب لمعرفة نوع الموجه. يجب كتابته
حالة الأحرف: تستخدم على نطاق واسع اليوم
الجزء الثاني
التعلم الموحد (FL)
السبب: عند استخدام نموذج التدريب، نحتاج إلى لتوفير بياناتنا الخاصة، مما سيؤدي إلى تسريب خصوصيتنا وهو أمر غير مقبول بالنسبة لبعض المؤسسات المالية والطبية
الطريقة: تستخدم كل مؤسسة البيانات لتدريب النموذج محليًا، ومن ثم يقوم بمركزة النموذج لدمج النموذج في مكان واحد
الحالة: Flock
FHEML
السبب: يتطلب التعلم الموحد من كل مشارك تدريب نموذج محليًا، ولكن هذا يمثل حدًا مرتفعًا جدًا لكل مشارك
الطريقة: استخدم FHE لإجراء تشفير متماثل بالكامل. نعم، يمكن تدريب النموذج مباشرة باستخدام البيانات المشفرة
العيوب: بطيء للغاية، ومكلف للغاية
الحالة: ZAMA، Privasea
الجزء 3< / p>
ZKML
السبب: عندما نستخدم الخدمات النموذجية التي يقدمها الآخرون، نريد التأكد من أنها كذلك تقديم خدمات نموذجية وفقًا لمتطلباتنا، بدلاً من استخدام نموذج صغير والعبث
الطريقة: دعها تستخدم ZK لإنشاء دليل يثبت أنه كذلك يقوم بالفعل بإجراء الحسابات التي يدعي أنه قام بها
العيوب: بطيئة جدًا ومكلفة
الحالة : المعامل
Skillneuron (skillneuron)
سبب حدوثه: نموذج اليوم يشبه الأسود نحن نزوده بالكثير من بيانات التدريب، لكننا لا نعرف ما تعلمه؛ ونأمل أن تكون هناك طريقة ما لتحسين النموذج في اتجاه معين، مثل التمتع بقدرة أقوى على الإدراك العاطفي، مع أخلاقيات أعلى المستوى
الطريقة: النموذج يشبه الدماغ، حيث تدير الخلايا العصبية في بعض المناطق العواطف، وتدير بعض المناطق الأخلاق. ابحث عن هذه العقد، ويمكننا إجراء تحسين مستهدف< /p>
الحالة: الاتجاه المستقبلي
5 طريقة تصنيف مشروع Web3 في السلسلة A
الجزء 1
< p style="text-align : left;">سيقسمها المؤلف إلى ثلاث فئات رئيسية:
Infra: بنية تحتية لا مركزية
البرامج الوسيطة: السماح لـ Infra بخدمة طبقة التطبيق بشكل أفضل
طبقة التطبيق: بعضها موجه مباشرة إلى تطبيق الجانب C/ الجانب B p>
الجزء الثاني
الطبقة التحتية: الذكاء الاصطناعي البنية التحتية مقسمة دائمًا إلى ثلاث فئات: خوارزمية قوة حوسبة البيانات (نموذج)
الخوارزمية اللامركزية (نموذج):
تقرير بحث TheBittensorHub:x.com/dvzhangtz/stat..@flock_ io
قوة الحوسبة اللامركزية:
p>
قوة الحوسبة العامة: @akashnet_, @ionet
قوة الحوسبة الخاصة: @rendernetwork (العرض) ,@gensynai(AI), @heuris_ai(Al)@exa_bits (A)(AD,
البيانات اللامركزية:
شرح البيانات: @PublciAl_، QuestLab
التخزين: IPFS, FIL
Oracle: Chainlink< /p>
الفهرس:الرسم البياني
الجزء الثالث
البرمجيات الوسيطة: كيفية جعل الأشعة تحت الحمراء تخدم طبقة التطبيق بشكل أفضل
الخصوصية: @zama fhe, @Privasea_ai< /p>
التحقق: EZKL, @ModulusLabs, @gizatechxyz
طبقة التطبيق: من الصعب في الواقع تصنيف جميع التطبيقات يمكننا فقط إدراج التطبيقات الأكثر تمثيلاً
تحليل البيانات
@_kaitoai ,@DuneAnalytics ,Adot
الوكيل
السوق: @myshell_ai
روبوت الدردشة المعرفي لـ Web3: @qnaweb3
ساعد الأشخاص على القيام بذلك العملية: @autonolas
6.ما هو نوع المكان الذي من المرجح أن ينتج مشاريع كبيرة؟
بادئ ذي بدء، كما هو الحال في المجالات الأخرى، فإن Infra عرضة للمشاريع الكبيرة، وخاصة النماذج اللامركزية وقدرة الحوسبة اللامركزية. ويشعر المؤلف أن تكلفتها الحدية منخفضة.
بعد ذلك، مستوحى من الأخ @ owenliang60، يشعر المؤلف أنه إذا ظهر تطبيق قاتل في طبقة التطبيق، فسيصبح أيضًا مشروعًا عالي المستوى.
بالنظر إلى تاريخ النماذج الكبيرة، كان التطبيق القاتل ChatGPT هو الذي دفعه إلى المقدمة، ولم يكن تكرارًا كبيرًا للتكنولوجيا، ولكنه كان كذلك تهدف إلى تحسين الدردشة لهذه المهمة. ربما سيكون هناك تطبيقات هائلة مثل Stepn/Friendtech في مجال A+Web3 في المستقبل، سننتظر ونرى