المصدر: Empower Labs
ما مدى التقدم الذي تم إحرازه في مجال الروبوتات مؤخرًا؟
في الآونة الأخيرة، كانت الأبحاث حول الروبوتات الذكية على قدم وساق، مع ظهور عروض توضيحية جديدة الواحدة تلو الأخرى.
أصدرت تسلا الجيل الثاني من أوبتيموس في منتصف ديسمبر. هذا الروبوت ليس منتجًا صناعيًا، ولكنه نموذج أولي خالص، ولكنه تم تشطيبه بشكل جيد. وفي العروض التوضيحية، أظهر أوبتيموس على شكل رائد فضاء قدراته الرياضية الرائعة. قال " ماسك " إن السبب وراء تصميمه ليكون بحجم الإنسان وشكله هو أن يحل محل العمل البشري بسلاسة ويؤدي أي شيء لا يرغب البشر في القيام به.
يمتلك الروبوت Tesla أسلوب صناعي قوي من الخيال العلمي ويبدو بناءه مكلفًا، وربما هذه الصورة هي التي تمنحه التوقع بأن "كل شيء يؤخذ على أنه أمر مسلم به". في الواقع، لم تعرض تسلا العديد من سيناريوهات التطبيق الخاصة بها، لذلك بدا أن الناس "ياه" بشأن هذا الأمر. ومع ذلك، فإن الإعلان عن الروبوتين الواحد تلو الآخر في يناير جعل الكثير من الناس يعبرون عن صدقهم "هاه؟"
أول من ظهر كان مشروع Stanford Mobile Aloha أعلن عنها فريق البحث بالجامعة. قد يكون السبب وراء إثارة هذا المشروع اهتمامًا واسع النطاق هو أن السيناريوهات التي وجدها للروبوتات أكثر عملية: الطبخ، واللعب مع القطط، وغسل الملابس. في الواقع، الابتكار الرئيسي لهذا المشروع هو أنه يستخدم أجهزة منخفضة التكلفة (أكثر من 30 ألف دولار أمريكي، والتي لا تزال باهظة الثمن للاستخدام المنزلي) لإنشاء روبوت متنقل مستقل ثنائي اليدين (على الرغم من أن مظهره ليس بشريًا جدًا) -like) ويمكنه تعلم المهارات البشرية. تبدو عملية التعلم هذه ثانوية بعض الشيء، خذ الطبخ كمثال، عليك تشغيله للطهي مرة واحدة، ثم يتذكر الإجراءات العامة. في هذا الوقت، من المستحيل عليه أن يمسك الوعاء بثبات مرة واحدة، لكن الشيء الرائع هو أنه سيجري العشرات من التدريبات المستقلة من خلال الكاميرا الموجودة على ذراعه قبل أن يتمكن من الإمساك به بثبات حقًا.
التالي، الشكل أصدرت الشركة مقطع فيديو للروبوت الذي يشبه الإنسان الشكل 01 وهو يصنع القهوة. يسمع هذا الروبوت الأمر الصوتي البشري "اصنع لي فنجانًا من القهوة" ويمكنه استخدام ماكينة القهوة الكبسولة بمهارة لصنع فنجان من القهوة. يطلق الشكل على هذا الإنجاز اسم "لحظة ChatGPT للروبوتات الشبيهة بالبشر"، ليس لأنه يستخدم نموذجًا لغويًا كبيرًا لفهم الأوامر الصوتية البشرية، ولكن لأن مهارة صنع القهوة تم تعلمها ببساطة من خلال مراقبة الحركات البشرية. وهذا الإنجاز صادم مثل ChatGPT. أنشأ الشكل 01 فهمًا لسلوك المهمة من خلال الملاحظة البصرية لسلوك البشر باستخدام ماكينة القهوة، ثم أتقن هذه المهارة من خلال عدة مرات من التدريب المستقل وتصحيح الأخطاء. يُظهر هذا الآفاق الواسعة للروبوتات البشرية ذات الأغراض العامة التي تعتمد على الذكاء الاصطناعي.
روبوت بيل جيتس في كل منزل< /h2>
في العدد الأول من مجلة "ساينتفيك أمريكان" عام 2007، كان هناك مقال يحمل توقيع بيل جيتس، وأذكر أنه كان عنوان الغلاف. . عنوان المقال "روبوت في كل بيت".
في المقالة، أعرب بيل جيتس عن سعادته الكبيرة بالفرص المتاحة في صناعة الروبوتات، لأنها تشبه إلى حد كبير عندما أسس شركة مايكروسوفت قبل 30 عامًا: ظهرت تقنيات متقدمة في الصناعة، لكن آلات الأعمال ذات المستوى الاحترافي لا تزال محتكرة في أيدي عدد قليل من الناس. الشركات الكبيرة. . على الرغم من أن الشركات الناشئة والمهوسين يواصلون إنشاء بعض الأشياء المثيرة للاهتمام، إلا أنهم مجزأون للغاية بحيث لا توجد معايير مشتركة وأدوات تطوير. ولذلك، تنبأ بيل جيتس بجرأة: طالما تم حل هذه المشكلة، فمن المؤكد أن الروبوتات ستدخل آلاف الأسر.
لذا، استثمرت Microsoft بشكل حاسم في الترويج لهذا الأمر في ذلك الوقت، وأنشأت قسم الروبوتات، وأطلقت Microsoft Robotics Studio، استعدادًا لتكرار النجاح الذي حققته Microsoft حققت النجاح في عصر الكمبيوتر الشخصي.
في المقال، استشهد بيل جيتس بتحدي DARPA 2004 الكلاسيكي عبر البلاد. نعم، وكالة مشاريع البحوث المتطورة الدفاعية (DARPA) الأسطورية هي التي اخترعت الإنترنت، والهدف من رعاية هذه المسابقة هو تمكين مركبة ملاحية مستقلة بالكامل من عبور أكثر من 140 ميلاً من صحراء موهافي. في العام الأول من المسابقة، كافح أفضل المتنافسين لقطع مسافة 7 أميال فقط، وفي العام الثاني، أكملت 5 سيارات المنافسة بنجاح، وركضوا بكل بساطة حتى النهاية. وتعكس هذه المنافسة بشكل كبير سرعة تطور تكنولوجيا الروبوتات. وهنا أيضًا تكمن ثقة بيل جيتس.
كانت جهود Microsoft في ذلك الوقت على مستوى أدوات التطوير. تتحسن قدرات أجهزة الاستشعار والمحركات وآليات المؤازرة وغيرها من الأجهزة بسرعة، كما تنخفض أسعارها، لكن على مستوى التطوير، يتعين عليك كتابة برنامج مخصص لكل قطعة من الأجهزة لتشغيلها. علاوة على ذلك، فإن كيفية تمكين المعالج الضعيف في ذلك الوقت من معالجة البيانات من أجهزة استشعار متعددة في الوقت الفعلي كانت أيضًا تحديًا كبيرًا. الحل الذي تقدمه Microsoft هو وضع معايير لبرامج التشغيل وتوفير إمكانات متعددة الخيوط. حتى أن Microsoft أطلقت برنامج .NET Micro Framework. يجب أن يكون الطلاب الذين يفهمون تكنولوجيا .NET قادرين على تخيل أن وضع مثل هذا القاتل الكبير في أدوات تطوير الروبوتات هو مجرد ضربة لتقليل الأبعاد. لا يحتاج مطورو الروبوتات إلى القلق بشأن جدولة الذاكرة والخيوط، بل يمكنهم فقط كتابة المنطق مباشرة.
ولكن اتضح لكي نكون صادقين، نحن نعلم بالفعل أن جهود مايكروسوفت في مجال الروبوتات لم تكن ناجحة، وتم حل قسم الروبوتات بالكامل في عملية إعادة تنظيم في عام 2014. وفي ملاحظات المؤلف المتقطعة، أشعر أن الأسباب الرئيسية قد تكون التكلفة والتطبيق. ففي نهاية المطاف، حتى يومنا هذا، يكلف الحصول على ذراع آلية في المنزل الكثير من المال، ولا نعرف ماذا نفعل بها.
لحظة ChatGPT للروبوتات؟
ارجع الجدول الزمني إلى الحاضر، سواء كان Mobile Aloha أو الشكل 01، فكلهم يظهرون مثل هذه القدرة: من خلال أجهزة الاستشعار ( سواء أكان الأمر يتعلق بكاميرا أو تشغيل المفاصل عن بعد) لتعلم إجراء ما، وإتقان هذا الإجراء حقًا من خلال ردود الفعل التدريبية المستقلة. ليس هذا فحسب، بل يمكن تشكيل مجموعة الإجراءات هذه إلى مهارة يمكن استحضارها بعد ذلك من خلال المحادثة الطبيعية. يمكن نسخ هذه المهارات إلى روبوتات مماثلة في أي وقت دون برمجة.
يبدو أن قدرات الروبوت قد وصلت بالفعل إلى مستوى جديد. وهذا أيضًا جعل الكثير من الناس يصرخون في انسجام تام: "هل وصلت الروبوتات أيضًا إلى لحظة التخريب مثل ChatGPT؟"
مقارنة ببيل قبل أكثر من عشر سنوات عندما بعد أن تنبأ جيتس، قطعت الروبوتات اليوم عدة خطوات جديدة:
1. أكثر تنوعا. في نظر بيل جيتس، يمكن للروبوتات أن تكون بأي شكل من الأشكال، طالما أنها تستطيع إكمال مهمة معينة. وعندما تسلل المؤلف نفسه إلى مجموعة الروبوتات لحضور اجتماع، لم يتمكن من الركض والزحف إلا عندما رأى مظاهراتهم. ولكن الآن يمكن للروبوتات أن تتمتع بالفعل بمهارات في المشاهد المنزلية، ويمكن نسخ هذه المهارات ونشرها. علاوة على ذلك، فإن تصميم الروبوت نفسه يميل إلى أن يكون أكثر شبهاً بالبشر، كما أنه مصمم أيضًا لأداء مهام عامة مختلفة نيابة عن الأشخاص.
2. التفاعل الطبيعي. وبدعم من ماجستير إدارة الأعمال متعدد الوسائط، يمكن لتكنولوجيا الروبوت الحالية فهم الأوامر الصوتية البشرية والتعلم من المدخلات مثل الكاميرات، ويعد هذا تقدمًا كبيرًا في مجال التعلم الآلي ويقلل بشكل كبير من صعوبة التطوير والاستخدام.
3. يتم تخفيض التكاليف بشكل أكبر. على الرغم من أن تكلفة الأجهزة المعلنة لـ Mobile Aloha لا تزال أكثر من 30.000 دولار أمريكي، إلا أن هذا يشمل قاعدة الهاتف المحمول. إذا قمت بحساب الذراع الروبوتية فقط، فيبدو أنه بالكاد يمكن اعتبارها جهازًا منزليًا متطورًا. قد تكون القاعدة المتنقلة واحدة من المواضيع الساخنة التالية، على سبيل المثال، منطق بعض الاستثمارات الأخيرة في شركة تيسلا هو "لا تعاملها كسيارة كهربائية، ولكن تعامل معها كقاعدة متنقلة عالمية للجيل القادم".
يعد جيم فان واحدًا من أكبر KOLs في هذا المجال، وهو أحد كبار العلماء في NVIDIA وكان أول متدرب في OpenAI. وفي تغريدة حديثة، أوضح سبب اعتقاده أن الروبوتات ستكون أكبر موضوع ساخن في عام 2024.
ولكن حتى هنا في تغريدة حماسية، يعتقد جيم أن "روبوتات الذكاء الاصطناعي المادية العالمية" لا تزال على بعد حوالي ثلاث سنوات.
وفي هذا الصدد، يبدو المؤلف متفائلاً بحذر، فالتفاؤل يأتي من رؤية مثل هذا التقدم الكبير، والحذر يأتي من الدروس المستفادة من مايكروسوفت.
ولكن هناك شيء واحد مؤكد، وهو أنه مثير بالفعل.