المصدر: Empower Labs
في سجل التقدم التكنولوجي، غالبًا ما تظهر التقنيات الثورية بشكل مستقل، حيث تؤدي كل منها إلى تغييرات في عصر ما. وعندما تلتقي تكنولوجيتان ثوريتان، فإن تصادمهما غالبا ما يكون له تأثير هائل. واليوم، نقف في مثل هذه اللحظة التاريخية: الذكاء الاصطناعي وتكنولوجيا التشفير، وهما تقنيتان جديدتان مدمرتان بنفس القدر، يدخلان مركز المسرح جنبًا إلى جنب.
نتصور أن العديد من التحديات في مجال الذكاء الاصطناعي يمكن حلها عن طريق تقنية التشفير؛ ونحن نتطلع إلى قيام وكيل الذكاء الاصطناعي ببناء شبكات اقتصادية مستقلة وتعزيز اعتماد تكنولوجيا التشفير على نطاق واسع ونأمل أيضًا أن يتمكن الذكاء الاصطناعي من تسريع تطوير التشفير للسيناريوهات الحالية في هذا المجال. تركز عيون لا حصر لها على هذا، وتتدفق الأموال الضخمة. ومثل أي كلمة طنانة، فهي تجسد رغبة الناس في الابتكار، والرؤية للمستقبل، وتحتوي أيضًا على طموح وجشع لا يمكن السيطرة عليهما.
ومع ذلك، وسط كل هذا الضجيج، لا نعرف سوى القليل جدًا عن القضايا الأساسية. ما مدى معرفة الذكاء الاصطناعي بالتشفير؟ هل يتمتع الوكيل المزود بنموذج لغة كبير بالقدرة الفعلية على استخدام أدوات التشفير؟ ما مدى الاختلاف الذي تؤديه النماذج المختلفة في مهام التشفير؟
ستحدد الإجابات على هذه الأسئلة التأثير المتبادل بين الذكاء الاصطناعي وتكنولوجيا التشفير، كما أنها ضرورية لاتجاه المنتج واختيار مسار التكنولوجيا في هذا المجال المتقاطع. لاستكشاف هذه القضايا، أجريت بعض تجارب التقييم على نماذج لغوية كبيرة. ومن خلال تقييم معرفتهم وقدراتهم في مجال التشفير، نقوم بقياس مستوى تطبيق التشفير للذكاء الاصطناعي وتحديد إمكانات وتحديات تكامل الذكاء الاصطناعي وتكنولوجيا التشفير.
دعونا نتحدث عن الاستنتاج أولاً
يتمتع نموذج اللغة الكبيرة بأداء ممتاز في المعرفة الأساسية للتشفير و blockchain، ويتمتع بفهم جيد لبيئة التشفير، ولكن الأداء ضعيف في الحسابات الرياضية وتحليل منطق الأعمال المعقد. فيما يتعلق بالمفاتيح الخاصة وعمليات المحفظة الأساسية، يتمتع النموذج بأساس مرضٍ، ولكنه يواجه تحديًا خطيرًا يتمثل في كيفية الاحتفاظ بالمفاتيح الخاصة في السحابة. يمكن للعديد من النماذج إنشاء كود عقد ذكي فعال لسيناريوهات بسيطة، ولكن لا يمكنها أداء المهام الصعبة بشكل مستقل مثل تدقيق العقود وإنشاء العقود المعقدة.
تتمتع النماذج التجارية مغلقة المصدر عمومًا بتقدم كبير. في معسكر المصادر المفتوحة، كان أداء Llama 3.1-405B فقط جيدًا، بينما فشلت جميع النماذج مفتوحة المصدر ذات أحجام المعلمات الأصغر. ومع ذلك، هناك إمكانات من خلال التوجيه الفوري للكلمات والتفكير المتسلسل وتكنولوجيا التعلم القليلة، وقد تم تحسين أداء جميع النماذج بشكل كبير.
التفاصيل التجريبية
تم اختيار 18 نموذجًا للغة تمثيلية ككائنات تقييم، بما في ذلك:
نماذج مغلقة المصدر: GPT-4o، GPT-4o Mini، Claude 3.5 Sonnet، Gemini 1.5 Pro، Grok2 beta (مصدر مغلق مؤقتًا) p>
نماذج مفتوحة المصدر: Llama 3.1 8B/70b/405B، وMistral Nemo 12B، وDeepSeek-coder-v2، وNous-hermes2، وPhi3 3.8 B/14b, Gemma2 9B\27B, Command-R
نموذج التحسين الرياضي: Qwen2-math-72B, MathΣtral
تغطي هذه النماذج النماذج مفتوحة المصدر التجارية والشائعة، مع كميات معلمات تتراوح أكثر من مائة مرة من 3.8 مليار إلى 405 مليار. وبالنظر إلى العلاقة الوثيقة بين تكنولوجيا التشفير والرياضيات، تم اختيار نموذجين للتحسين الرياضي خصيصا للتجربة.
تشمل مجالات المعرفة التي تغطيها التجربة التشفير، وأساسيات blockchain، والمفتاح الخاص وعمليات المحفظة، والعقود الذكية، وDAO والحوكمة، والإجماع والنماذج الاقتصادية، Dapp/DeFi/NFT، على -تحليل بيانات السلسلة، وما إلى ذلك. يتكون كل مجال من سلسلة من الأسئلة والمهام التي تتراوح من السهل إلى الصعب، والتي لا تختبر الاحتياطي المعرفي للنموذج فحسب، بل تختبر أيضًا أدائه في سيناريوهات التطبيق من خلال مهام المحاكاة.
يأتي تصميم المهام من مصادر متنوعة. بعضها يأتي من مدخلات العديد من الخبراء في مجال التشفير، ويتم إنشاء الجزء الآخر بمساعدة الذكاء الاصطناعي ومراجعته يدويًا. التأكد من دقة المهام وتحديها. تستخدم بعض المهام أسئلة متعددة الاختيارات بتنسيق بسيط نسبيًا لتسهيل الاختبار الآلي الموحد والتسجيل. يعتمد جزء آخر من الاختبار تنسيق أسئلة أكثر تعقيدًا، ويتم إجراء عملية الاختبار من خلال مزيج من أتمتة البرنامج + الدليل + الذكاء الاصطناعي. يتم تقييم جميع مهام الاختبار باستخدام طريقة الاستدلال ذات العينة الصفرية ولا تقدم أي أمثلة أو توجيهات فكرية أو مطالبات تعليمية.
نظرًا لأن تصميم التجربة نفسها تقريبي نسبيًا ولا يتمتع بالدقة الأكاديمية الكافية، فإن الأسئلة والمهام المستخدمة للاختبار بعيدة كل البعد عن تغطية مجال التشفير وإطار الاختبار بشكل كامل ليست شاملة. ولذلك، لا تسرد هذه المقالة بيانات تجريبية محددة، ولكنها تركز على مشاركة بعض الأفكار من التجارب.
المعرفة/المفاهيم
أثناء عملية التقييم،نموذج لغة كبير في خوارزميات التشفير وأساسيات blockchain وتطبيقات DeFi أداء ممتاز في اختبارات المعرفة الأساسية في مختلف المجالات. على سبيل المثال، أعطت جميع النماذج إجابات دقيقة على الأسئلة التي اختبرت فهم مفهوم توفر البيانات. أما بالنسبة للسؤال الذي يقيم مدى فهم النموذج لبنية معاملات الإيثيريوم، على الرغم من أن كل نموذج له إجابات مختلفة قليلاً في التفاصيل، إلا أنها تحتوي بشكل عام على معلومات أساسية صحيحة. أما أسئلة الاختيار من متعدد التي تدرس المفاهيم فهي أقل صعوبة، كما أن دقة جميع النماذج تقريبًا تزيد عن 95%.
الأسئلة والأجوبة المفاهيمية صعبة تمامًا بالنسبة للنماذج الكبيرة.
الحساب/منطق الأعمال
ومع ذلك، عندما يتعلق الأمر بالأسئلة التي تتطلب حسابات محددة، فإن الوضع يكون معكوسًا. مشكلة بسيطة في حساب خوارزمية RSA تضع معظم النماذج في موقف صعب. من السهل أن نفهم: تعمل نماذج اللغة الكبيرة في المقام الأول من خلال تحديد وتكرار الأنماط في بيانات التدريب، بدلاً من الفهم العميق لطبيعة المفاهيم الرياضية. يكون هذا القيد واضحًا بشكل خاص عند التعامل مع المفاهيم الرياضية المجردة مثل العمليات المعيارية والعمليات الأسية. نظرًا لأن مجال التشفير يرتبط ارتباطًا وثيقًا بالرياضيات، فهذا يعني أنه من غير الموثوق الاعتماد بشكل مباشر على نماذج الحسابات الرياضية المتعلقة بالتشفير.
في مشكلات الحوسبة الأخرى، يكون أداء النماذج اللغوية الكبيرة أيضًا غير مرضٍ. على سبيل المثال، بالنسبة للسؤال البسيط المتعلق بحساب الخسارة غير الدائمة لـ AMM، على الرغم من أنه لا يتضمن عمليات حسابية معقدة، إلا أن 4 نماذج فقط من أصل 18 نموذجًا أعطت الإجابة الصحيحة. أما بالنسبة لسؤال أساسي آخر حول حساب احتمالية الكتلة، فقد حصلت جميع النماذج على إجابة خاطئة. لقد حيرت جميع النماذج، ولم يكن أي منها صحيحًا. وهذا لا يكشف فقط عن عيوب نماذج اللغات الكبيرة في الحسابات الدقيقة، ولكنه يعكس أيضًا مشاكلها الرئيسية في تحليل منطق الأعمال. ومن الجدير بالذكر أنه حتى نموذج التحسين الرياضي فشل في إظهار مزايا واضحة في المسائل الحسابية، وكان أدائه مخيبا للآمال.
ومع ذلك، فإن مشكلة الحساب الرياضي ليست غير قابلة للحل. إذا أجرينا تعديلًا بسيطًا وطلبنا من ماجستير إدارة الأعمال توفير كود Python المقابل بدلاً من حساب النتائج مباشرةً، فسيتم تحسين معدل الدقة بشكل كبير. بأخذ مشكلة حساب RSA المذكورة أعلاه كمثال، يمكن تنفيذ أكواد Python التي تقدمها معظم النماذج بسلاسة وتؤدي إلى نتائج صحيحة. في بيئات الإنتاج الفعلية، يمكن توفير رموز خوارزمية محددة مسبقًا لتجاوز الحساب الذاتي لـ LLMs، وهو ما يشبه كيفية تعامل البشر مع مثل هذه المهام. على مستوى منطق الأعمال، يمكن أيضًا تحسين أداء النموذج بشكل فعال من خلال التوجيه الفوري المصمم بعناية.
إدارة المفاتيح الخاصة وتشغيل المحفظة
إذا سألت الوكيل عن السيناريو الأول لاستخدام العملة المشفرة، فابحث عن الجواب هو الدفع. يمكن اعتبار العملات المشفرة هي الشكل الأصلي للعملة الخاصة بالذكاء الاصطناعي. بالمقارنة مع العقبات العديدة التي يواجهها الوكلاء في النظام المالي التقليدي، يعد استخدام تقنية التشفير خيارًا طبيعيًا لتزويد أنفسهم بالهويات الرقمية وإدارة الأموال من خلال المحافظ المشفرة. لذلك، يشكل إنشاء وإدارة المفاتيح الخاصة وعمليات المحفظة المختلفة متطلبات المهارات الأساسية للوكيل حتى يتمكن من استخدام شبكة التشفير بشكل مستقل.
يكمن جوهر إنشاء المفاتيح الخاصة بشكل آمن في أرقام عشوائية عالية الجودة، وهي قدرة لا تمتلكها نماذج اللغات الكبيرة بشكل واضح. ومع ذلك، تتمتع النماذج بفهم كافٍ لأمن المفتاح الخاص. عندما يُطلب منها إنشاء مفتاح خاص، تختار معظم النماذج استخدام التعليمات البرمجية (مثل المكتبات المرتبطة بـ Python) لتوجيه المستخدمين لإنشاء مفاتيح خاصة بشكل مستقل. حتى لو كان النموذج يوفر مفتاحًا خاصًا بشكل مباشر، فمن الواضح أن هذا مخصص لأغراض العرض التوضيحي فقط وليس مفتاحًا خاصًا آمنًا يمكن استخدامه مباشرة. وفي هذا الصدد، أظهرت جميع النماذج الكبيرة أداء مرضيا.
تواجه إدارة المفاتيح الخاصة بعض التحديات، والتي ترجع بشكل أساسي إلى القيود المتأصلة في البنية التقنية بدلاً من الافتقار إلى إمكانات النموذج. عند استخدام نموذج منشور محليًا، يمكن اعتبار المفتاح الخاص الذي تم إنشاؤه آمنًا نسبيًا. ومع ذلك، إذا تم استخدام نموذج سحابي تجاري، فيجب أن نفترض أن المفتاح الخاص قد تم كشفه لمشغل النموذج لحظة إنشائه. ومع ذلك، بالنسبة للوكيل الذي يهدف إلى العمل بشكل مستقل، فمن الضروري أن يكون لديه أذونات المفتاح الخاص، مما يعني أن المفتاح الخاص لا يمكن أن يكون محليًا للمستخدم فقط. في هذه الحالة، لم يعد الاعتماد فقط على النموذج نفسه كافيًا لضمان أمان المفتاح الخاص، ويجب تقديم خدمات أمان إضافية مثل بيئة تنفيذ موثوقة أو HSM.
إذا كان من المفترض أن الوكيل يحتفظ بالفعل بالمفتاح الخاص بأمان ويقوم بتنفيذ عمليات أساسية مختلفة على هذا الأساس، فقد أظهرت النماذج المختلفة في الاختبار قدرات جيدة. على الرغم من وجود أخطاء غالبًا في الخطوات والأكواد التي تم إنشاؤها، إلا أنه يمكن حل هذه المشكلات إلى حد كبير من خلال بنية هندسية مناسبة. يمكن القول أنه من منظور تقني، لم تعد هناك عقبات كثيرة أمام الوكيل لإجراء عمليات المحفظة الأساسية بشكل مستقل.
العقد الذكي
يتم تنفيذ إمكانات الفهم والاستخدام والكتابة وتحديد المخاطر الخاصة بالعقود الذكية بواسطة وكيل الذكاء الاصطناعي في مفتاح عالمي متصل بالمهام المعقدة وبالتالي منطقة اختبار رئيسية للتجارب. أظهرت النماذج اللغوية الكبيرة إمكانات كبيرة في هذا المجال، لكنها كشفت أيضًا عن بعض المشكلات الواضحة.
في الاختبار، تمكنت جميع النماذج تقريبًا من الإجابة بشكل صحيح على مفاهيم العقد الأساسية وتحديد الأخطاء البسيطة. فيما يتعلق بتحسين الغاز التعاقدي، يمكن لمعظم النماذج تحديد نقاط التحسين الرئيسية وتحليل الصراعات التي قد تنتج عن التحسين. ومع ذلك، عندما يتعلق الأمر بمنطق الأعمال العميق، تبدأ حدود النماذج الكبيرة في الظهور.
خذ عقد استحقاق الرمز المميز كمثال: فهمت جميع النماذج وظائف العقد بشكل صحيح، ووجدت معظم النماذج العديد من نقاط الضعف المتوسطة والمنخفضة المخاطر. ومع ذلك، لا يمكن لأي نموذج أن يكتشف بشكل مستقل ثغرة أمنية عالية المخاطر مخبأة في منطق الأعمال والتي قد تتسبب في حجز بعض الأموال في ظل ظروف خاصة. ومن خلال اختبارات متعددة باستخدام عقود حقيقية، كان أداء النموذج هو نفسه تقريبًا.
يُظهر هذا أن فهم النموذج الكبير للعقود لا يزال على المستوى الرسمي ويفتقر إلى فهم منطق الأعمال العميق. ومع ذلك، بعد تزويدها بتلميحات إضافية، تمكنت بعض النماذج في النهاية من تحديد نقاط الضعف المخفية بشدة في العقود المذكورة أعلاه بشكل مستقل. بناءً على حكم الأداء هذا، وبدعم من التصميم الهندسي الجيد، يتمتع النموذج الكبير بالقدرة الأساسية على العمل كطيار مساعد في مجال العقود الذكية. ومع ذلك، لا يزال هناك طريق طويل لنقطعه قبل أن نتمكن من القيام بشكل مستقل بمهام مهمة مثل تدقيق العقود.
الشيء الوحيد الذي يحتاج إلى شرح هو أن المهام المتعلقة بالكود في التجربة مخصصة بشكل أساسي للعقود ذات المنطق البسيط وأقل من 2000 سطر من التعليمات البرمجية. بالنسبة للمشاريع المعقدة واسعة النطاق، دون الضبط الدقيق أو هندسة الكلمات السريعة المعقدة، أعتقد أنه من الواضح أنها تتجاوز قدرات المعالجة الفعالة للنموذج الحالي ولم يتم تضمينها في الاختبار. بالإضافة إلى ذلك، يتضمن هذا الاختبار Solidity فقط ولا يشمل لغات العقود الذكية الأخرى مثل Rust وMove.
بالإضافة إلى محتوى الاختبار أعلاه، تغطي التجربة أيضًا العديد من الجوانب بما في ذلك سيناريوهات DeFi، وDAO وإدارتها، وتحليل البيانات على السلسلة، وتصميم آلية الإجماع، وTokennomics. لقد أظهرت النماذج اللغوية الكبيرة قدرات معينة في هذه الجوانب. نظرًا لأن العديد من الاختبارات لا تزال قيد التقدم وأن طرق وأطر الاختبار يتم تحسينها باستمرار، فلن تتعمق هذه المقالة في هذه المجالات.
الاختلافات في النماذج
من بين جميع النماذج اللغوية الكبيرة المشاركة في التقييم، واصل GPT-4o وClaude 3.5 Sonnet نجاحهما في نماذج أخرى. المجالات مع الأداء المتميز، هو الزعيم بلا منازع. عند مواجهة أسئلة أساسية، يمكن لكلا النموذجين دائمًا تقديم إجابات دقيقة؛ وفي تحليل السيناريوهات المعقدة، يمكنهما تقديم رؤى متعمقة وموثقة جيدًا. حتى أنه يظهر معدل فوز مرتفع في مهام الحوسبة التي لا تجيدها النماذج الكبيرة. وبطبيعة الحال، فإن معدل النجاح "المرتفع" هذا نسبي ولم يصل بعد إلى مستوى الإنتاج المستقر في بيئة الإنتاج.
في معسكر النماذج مفتوحة المصدر، يتفوق Llama 3.1-405B كثيرًا على أقرانه بفضل مقياس المعلمات الكبير وخوارزميات النماذج المتقدمة. في نماذج أخرى مفتوحة المصدر ذات أحجام معلمات أصغر، لا توجد فجوة كبيرة في الأداء بين النماذج. على الرغم من أن النتائج مختلفة قليلاً، إلا أنها بشكل عام بعيدة عن خط النجاح.
لذلك، إذا كنت ترغب حاليًا في إنشاء تطبيقات الذكاء الاصطناعي المتعلقة بالتشفير، فإن هذه النماذج ذات المعلمات الصغيرة والمتوسطة الحجم ليست خيارًا مناسبًا.
برز نموذجان بشكل خاص في مراجعتنا. الأول هو نموذج Phi-3 3.8B الذي أطلقته شركة مايكروسوفت، وهو أصغر نموذج مشارك في هذه التجربة، إلا أنه يصل إلى مستوى أداء يعادل نموذج 8B-12B مع أقل من نصف عدد المعلمات في بعض المواصفات الفئات، وحتى أفضل في هذه القضية. تسلط هذه النتيجة الضوء على أهمية تحسين بنية النموذج واستراتيجيات التدريب التي لا تعتمد فقط على الزيادات في حجم المعلمة.
أصبح نموذج Cohere's Command-R "حصانًا أسود" مفاجئًا - بالعكس. إن Command-R ليس معروفًا جيدًا مقارنة بالنماذج الأخرى، لكن Cohere هي شركة نموذجية كبيرة تركز على سوق 2B، وأعتقد أنه لا تزال هناك العديد من نقاط التقارب مع مجالات مثل تطوير الوكيل، لذلك تم تضمينها على وجه التحديد في نطاق الاختبار. ومع ذلك، احتل Command-R بمعلمات 35B المرتبة الأخيرة في معظم الاختبارات، وخسر أمام العديد من الطرز التي تقل عن 10B.
أثارت هذه النتيجة التفكير: عندما تم إصدار Command-R، ركز على تحسين الاسترجاع وقدرات الإنشاء، ولم ينشر حتى نتائج اختبار قياس الأداء بشكل منتظم. هل يعني هذا أنه "مفتاح خاص" لا يمكنه إطلاق العنان لإمكاناته الكاملة إلا في سيناريوهات محددة؟
القيود التجريبية
في هذه السلسلة من الاختبارات، لدينا فهم أولي لقدرات الذكاء الاصطناعي في مجال التشفير. وبطبيعة الحال، هذه الاختبارات بعيدة كل البعد عن المعايير المهنية. إن تغطية مجموعة البيانات ليست كافية على الإطلاق، والمعايير الكمية للإجابات قاسية نسبيًا، ولا يزال هناك نقص في آلية تسجيل محسنة وأكثر دقة، وسيؤثر ذلك على دقة نتائج التقييم وقد يؤدي إلى التقليل من تقديرها أداء بعض النماذج.
في ما يتعلق بطريقة الاختبار، استخدمت التجربة طريقة واحدة فقط للتعلم بدون فرصة، ولم تستكشف سلسلة التفكير والتعلم بعدد قليل من اللقطات وما إلى ذلك التي يمكن أن تلهم إمكانات أكبر للنموذج. فيما يتعلق بمعلمات النموذج، تم استخدام معلمات النموذج القياسية في التجارب، ولم يتم فحص تأثير إعدادات المعلمات المختلفة على أداء النموذج. تحد طرق الاختبار الفردية الشاملة هذه من تقييمنا الشامل لإمكانات النموذج وتفشل في استكشاف الاختلافات في أداء النموذج بشكل كامل في ظل ظروف محددة.
على الرغم من أن شروط الاختبار كانت بسيطة نسبيًا، إلا أن هذه التجارب لا تزال تنتج العديد من الأفكار القيمة وتوفر مرجعًا للمطورين لبناء التطبيقات.
يحتاج مجال التشفير إلى معيار مرجعي خاص به
في مجال الذكاء الاصطناعي، تلعب المعايير دورًا رئيسيًا. التطور السريع لتكنولوجيا التعلم العميق الحديثة نشأ من ImageNET الذي أكمله البروفيسور Li Feifei في عام 2012، وهو معيار قياسي ومجموعة بيانات في مجال رؤية الكمبيوتر.
من خلال توفير معايير تقييم موحدة، لا توفر المعايير للمطورين أهدافًا ونقاط مرجعية واضحة فحسب، بل تعمل أيضًا على دفع التقدم التكنولوجي في جميع أنحاء الصناعة. وهذا ما يفسر سبب تركيز كل نموذج لغة كبير تم إصداره حديثًا على إعلان نتائجه وفقًا لمعايير مختلفة. تصبح هذه النتائج "لغة عالمية" لقدرات النماذج، مما يسمح للباحثين بتحديد الاختراقات، وللمطورين لاختيار النماذج الأكثر ملاءمة لمهام محددة، وللمستخدمين لاتخاذ خيارات مستنيرة بناءً على بيانات موضوعية. والأهم من ذلك، أن الاختبارات المعيارية غالبًا ما تبشر بالاتجاه المستقبلي لتطبيقات الذكاء الاصطناعي، وتوجيه الاستثمار في الموارد والتركيز البحثي.
إذا كنا نعتقد أن هناك إمكانات هائلة عند تقاطع الذكاء الاصطناعي والتشفير، فإن إنشاء معايير تشفير مخصصة يصبح مهمة عاجلة. وقد يصبح إنشاء المعايير بمثابة جسر رئيسي يربط بين مجالي الذكاء الاصطناعي والتشفير، وتحفيز الابتكار، وتوفير إرشادات واضحة للتطبيقات المستقبلية.
ومع ذلك، بالمقارنة مع المعايير الناضجة في المجالات الأخرى، فإن بناء المعايير في مجال التشفير يواجه تحديات فريدة من نوعها: تكنولوجيا التشفير تتطور بسرعة، ونظام المعرفة الصناعية لم يتم ترسيخه بعد، وهناك هو عدم وجود توافق في الآراء في اتجاهات أساسية متعددة. باعتباره مجالًا متعدد التخصصات، يغطي التشفير التشفير والأنظمة الموزعة والاقتصاد وما إلى ذلك، كما أن تعقيده يتجاوز بكثير تعقيد مجال واحد. والأمر الأكثر صعوبة هو أن معيار التشفير لا يحتاج إلى تقييم المعرفة فحسب، بل يفحص أيضًا القدرة العملية للذكاء الاصطناعي على استخدام تكنولوجيا التشفير، الأمر الذي يتطلب تصميم بنية تقييم جديدة. ويزيد الافتقار إلى مجموعات البيانات ذات الصلة من الصعوبة.
إن تعقيد هذه المهمة وأهميتها يحددان أنه لا يمكن إكمالها بواسطة شخص واحد أو فريق واحد. إنها تحتاج إلى جمع حكمة العديد من الأطراف من المستخدمين والمطورين وخبراء التشفير وباحثي التشفير إلى عدد أكبر من الأشخاص في المجالات متعددة التخصصات، وتعتمد على مشاركة المجتمع واسعة النطاق والإجماع. ولذلك، فإن معيار التشفير يحتاج إلى مناقشة أوسع، لأنه ليس عملاً تقنيًا فحسب، بل هو أيضًا انعكاس عميق لكيفية فهمنا لهذه التكنولوجيا الناشئة.
تذييل: عند هذه النقطة، الموضوع لم ينته بعد. في المقالات التالية، سوف أتعمق في الأفكار والتحديات المحددة لبناء معايير الذكاء الاصطناعي في مجال العملات المشفرة. لا تزال التجربة مستمرة، ونقوم باستمرار بتحسين نموذج الاختبار وإثراء مجموعة البيانات وتحسين إطار التقييم وتحسين مشروع الاختبار الآلي. ومن خلال الالتزام بمفهوم التعاون المفتوح، ستكون جميع الموارد ذات الصلة في المستقبل - بما في ذلك مجموعات البيانات والنتائج التجريبية وأطر التقييم ورموز الاختبار الآلية، مفتوحة المصدر كموارد عامة.