نموذج الذكاء الاصطناعي Claude 3.7 Sonnet يتحدى Pokémon Red في تجربة حية
يثبت الذكاء الاصطناعي قدرته على التنقل في العالم الرقمي بطرق غير متوقعة.
تلعب النسخة الأحدث من Claude من Anthropic، والمعروفة باسم Claude 3.7 Sonnet، لعبة "Pokémon Red"، وليس فقط الضغط على أزرار عشوائية.
إنها عملية التخطيط الاستراتيجي النشط، واتخاذ القرارات، والتكيف مع التحديات في الوقت الفعلي.
نموذج الذكاء الاصطناعي الخاص بـ Anthropic،البث المباشر على Twitch تحت قناة "ClaudePlaysPokemon"، هزم بالفعل ثلاثة من قادة الصالات الرياضية، وهو إنجاز كانت نماذج كلود السابقة تكافح لتحقيقه.
تُظهر هذه التجربة كيف يتقدم الذكاء الاصطناعي إلى ما هو أبعد من تنفيذ المهام البسيطة إلى سيناريوهات حل المشكلات الأكثر تعقيدًا.
يتعلم الذكاء الاصطناعي كيفية القتال والتكيف والتغلب على العقبات
على عكس سابقتها، Claude 3.5 Sonnet، التي فشلت في الخروج من منزل اللاعب في "بوكيمون ريد"، فقد أظهرت Claude 3.7 Sonnet تقدماً ملحوظاً.
في غضون ساعات، هزم بروك، أول زعيم للصالة الرياضية، وبعد أيام قليلة، تغلب على ميستي.
وأوضح أنثروبيك أن هذا النجاح يأتي من قدرة النموذج على تدوين الملاحظات ومراقبة شاشة اللعبة واستخدام استدعاءات الوظائف للتفاعل مع اللعبة.
بدلاً من الاعتماد على السلوكيات المدربة مسبقًا، تقوم Claude 3.7 Sonnet بمعالجة كل موقف، والتخطيط مسبقًا، والتعديل عند الضرورة - على الرغم من أنها ليست خالية من الصراعات.
في مرحلة ما، أصبح كلود عالقًا أمام جدار صخري، محاولًا باستمرار التحرك من خلاله.
استغرق الأمر بعض الوقت قبل أن يتعرف الذكاء الاصطناعي على طريق بديل.
أعطى أحد المستخدمين على Twitch وجهة نظر فكاهية حول الموقف،
من سيفوز، الذكاء الاصطناعي الذي استغرق برمجته آلاف الساعات، أم جدار صخري واحد؟
في النهاية، تمكن كلود من إيجاد طريقة للتغلب على العقبة، موضحًا قدرته على التعلم من الأخطاء بدلاً من تكرار الإجراءات الفاشلة إلى ما لا نهاية.
أصبحت ألعاب الفيديو التي تعتمد على الذكاء الاصطناعي معيارًا بحثيًا
إن لعب نماذج الذكاء الاصطناعي لألعاب الفيديو ليس مفهومًا جديدًا، لكنه يظل طريقة قيمة لاختبار قدراتهم على التفكير.
في مارس 2024، استخدم الباحثون ChatGPT من OpenAI لتشغيل لعبة إطلاق النار الكلاسيكية من منظور الشخص الأول "Doom"، وتمكنوا بنجاح من الانتقال إلى الغرفة الأخيرة من اللعبة.
وفي نفس الوقت تقريبًا، قدمت شركة Google DeepMind وكيلها متعدد العوالم القابل للتطوير والإرشاد (SIMA)، القادر على تشغيل ألعاب مثل "No Man's Sky"، و"Teardown"، و"Valheim" باستخدام الصور التي تظهر على الشاشة فقط وتعليمات اللغة الطبيعية - دون الحاجة إلى الوصول إلى كود المصدر أو واجهات برمجة التطبيقات الخاصة.
وعلى عكس الأتمتة البسيطة المبنية على القواعد، تُظهر نماذج الذكاء الاصطناعي هذه مستوى من التفكير العام.
وأشارت أنثروبيك إلى أن "بوكيمون ريد" كان اختبارًا مفيدًا بشكل خاص لسونيت كلود 3.7، لأنه يتطلب من النموذج حل الألغاز واتخاذ قرارات إستراتيجية بدلاً من مجرد الاستجابة للأوامر المباشرة.
عودة إلى Twitch يلعب Pokémon، ولكن مع لاعب الذكاء الاصطناعي
بالنسبة للعديد من الأشخاص، فإن مشاهدة كلود يلعب "بوكيمون ريد" تعيد إلى الأذهان ذكريات "Twitch Plays Pokémon"، وهي التجربة الاجتماعية عبر الإنترنت التي جرت عام 2014 حيث سيطر آلاف اللاعبين بشكل جماعي على اللعبة من خلال أوامر الدردشة.
إن الطبيعة الفوضوية والتعاونية لهذا الحدث حولته إلى ظاهرة ثقافية.
الآن، بدلاً من مجتمع يعمل معًا، يشاهد المشاهدون صراع الذكاء الاصطناعي من خلال مغامرة فردية.
تتمتع التجربة بشعور مختلف، فهي أكثر مراقبة من كونها تفاعلية.
يتناقض نهج كلود الحذر والمتدرج بشكل حاد مع طريقة اللعب غير المنتظمة التي يقودها الجمهور في لعبة Twitch Plays Pokémon الأصلية.
لقد حدثت لحظة مسلية بشكل خاص عندما تفاعل كلود، أثناء بحثه عن البروفيسور أوك، بشكل متكرر مع الشخصية غير القابلة للعب الخاطئة على الرغم من أنه تحدث إليهم عدة مرات من قبل.
بعض المشاهدين أصبحوا غير صبورين، في حين أن البعض الآخر أصبحوا أكثر تفهمًا:
"استرخوا يا شباب. قبل أن نخرج وندخل مختبر أوك حوالي 10 مرات قبل أن نفهم كيفية المضي قدمًا."
وهذه ليست المرة الأولى التي يتم فيها استخدام الذكاء الاصطناعي في مثل هذه المحاولة.
في أكتوبر 2023، شارك مهندس البرمجيات في سياتل بيتر وايددن مقطع فيديو على يوتيوب يوضح كيف قام بتعليم الذكاء الاصطناعي المعزز للعب بوكيمون.
ال لقد أمضى الذكاء الاصطناعي أكثر من 50 ألف ساعة في اكتشاف اللعبة ولكن على طول الطريق، أصبح مشتتًا بعض الشيء - في بعض الأحيان كان يتوقف فقط للاستمتاع بالمناظر الطبيعية ذات البكسلات بدلاً من اللعب فعليًا.
على الرغم من أن Claude 3.7 Sonnet يتبنى نهجًا بطيئًا وثابتًا، فإن تقدمه في "Pokémon Red" يقدم لمحة عن مستقبل الذكاء الاصطناعي.
وهو يوضح كيف يمكن للنماذج أن تتطور لمواجهة التحديات الجديدة من خلال التفكير في المشاكل خطوة بخطوة، بدلاً من مجرد التدريب على مهام محددة.