المصدر: InfoQ
في تمام الساعة 4:00 صباحًا بتوقيت بكين، على الجانب الآخر من المحيط في مركز مؤتمرات سان خوسيه في سان خوسيه، كاليفورنيا، انعقد مؤتمر GTC 2024 والمعروف باسم تقنية NVIDIA العيد، على قدم وساق. مع افتتاح NVIDIA 2024، وقف الملياردير هوانغ، الذي كان يرتدي سترته الجلدية المميزة، في وسط المسرح وأطلق بهدوء سلسلة أخرى من رقائق "القنبلة النووية" الفائقة بعد H100 وA100.
السبب وراء جذب GTC لهذا العام الكثير من الاهتمام هو أن Nvidia حققت نجاحًا كبيرًا من حيث الأداء المالي في مجال الذكاء الاصطناعي في العام الماضي. بدءًا من سلسلة Volta V100 GPU وحتى أحدث شرائح Ampere A100 وHopper H100، حصلت الشركة على لقب ملك رقائق الذكاء الاصطناعي.
1. أضافت عائلة GPU "وافدًا جديدًا"، وتزدهر شريحة بنية Blackwell الجديدة
قبل بدء مؤتمر GTC هذا، بدأت وسائل الإعلام الأجنبية بالفعل في نشر الشائعات: سيكون Huang Renxun موجودًا في GTC. تم إصدار منتج جديد لعائلة GPU في عام 2024، ومن المؤكد أن شرائح سلسلة B200 وGB200 التي تستخدم بنية Blackwell وصلت كما هو مقرر.
وفقًا لـ NVIDIA، تعد سلسلة شرائح بنية Blackwell أقوى عائلة شرائح الذكاء الاصطناعي حتى الآن.
وفقًا لـ Lao Huang، يحتوي B200 على 208 مليارات ترانزستور (بينما يحتوي H100/H200 على 80 مليار ترانزستور). ويستخدم عملية TSMC's 4NP ويمكنه دعم نماذج الذكاء الاصطناعي بما يصل إلى 10 تريليون معلمة. 3 يتكون من 175 مليار معلمة. كما أنه يوفر أيضًا 20 بيتافلوب من أداء الذكاء الاصطناعي من وحدة معالجة رسومات واحدة - يمكن لوحدة H100 واحدة تقديم ما يصل إلى 4 بيتافلوب من حوسبة الذكاء الاصطناعي.
ولكن تجدر الإشارة إلى أن Blackwell B200 ليس وحدة معالجة رسومات واحدة بالمعنى التقليدي. وتتكون من شريحتين مقترنتين بإحكام متصلتين عبر اتصال NV-HBI (واجهة النطاق الترددي العالي Nvidia High Bandwidth Interface) بسرعة 10 تيرابايت/ثانية للتأكد من أنهما تعملان كشريحة واحدة متماسكة تمامًا.
ترث منصة GPU، التي سميت على اسم عالم الرياضيات ديفيد هارولد بلاكويل، بنية Hopper التي قدمتها Nvidia قبل عامين، وقد أدت سلسلة من المنتجات المبنية على هذه البنية إلى ارتفاع أعمال Nvidia وأسعار أسهمها.
تعد هذه البنية خطوة أخرى مهمة للأمام في مجال أمان الذكاء الاصطناعي. توفر Blackwell ذكاءً اصطناعيًا آمنًا مع خدمات RAS ذاتية الاختبار بنسبة 100% داخل النظام وتشفيرًا كامل الأداء، مما يعني أن البيانات ليست آمنة أثناء النقل فحسب، بل أيضًا في حالة الراحة وعند الحوسبة.
سيتم دمج Blackwell في شريحة GB200 Grace Blackwell الفائقة من Nvidia، والتي تربط وحدتي معالجة رسوميات B200 Blackwell بوحدة معالجة مركزية Grace. ولم تكشف نفيديا عن الأسعار.
ومن المتوقع أن تتوفر الشريحة الجديدة في وقت لاحق من هذا العام. وقالت Nvidia إن AWS وDell Technologies وGoogle وMeta وMicrosoft وOpenAI وTesla تخطط لاستخدام وحدات معالجة الرسوميات Blackwell.
"الذكاء الاصطناعي التوليدي هو وقال هوانغ في كلمته: "إنها تحدد التكنولوجيا في عصرنا". "إن وحدات معالجة الرسوميات من Blackwell هي المحرك الذي يقود هذه الثورة الصناعية الجديدة. ومن خلال العمل مع الشركات الأكثر ديناميكية في العالم، سوف نحقق وعد الذكاء الاصطناعي لكل صناعة."
أصدرت NVIDIA أيضًا جهاز GB200 NVL72 السائل البارد- يحتوي نظام الرف، الذي يحتوي على 36 جيجا بايت 200 من شرائح Grace Blackwell الفائقة ولديه 1440 بيتافلوب (المعروف أيضًا باسم 1.4 إكسافلوب) من قوة الاستدلال، على ما يقرب من ميلين من الكابلات بالداخل، مع إجمالي 5000 كابل فردي.
تقول Nvidia أن GB200 NVL72 يوفر ما يصل إلى 30x تحسينات في الأداء مقارنة بنفس العدد من وحدات معالجة الرسومات H100 Tensor Core المستخدمة لأغراض الاستدلال. بالإضافة إلى ذلك، يمكن للنظام تقليل التكاليف واستهلاك الطاقة بما يصل إلى 25 مرة.
GB200 NVL72
على سبيل المثال، كان تدريب نموذج معلمة 1.8 تريليون يتطلب سابقًا 8000 وحدة معالجة رسوميات Hopper و15 ميجاوات من الطاقة. اليوم، هناك حاجة إلى 2000 وحدة معالجة رسومات Blackwell فقط للقيام بذلك، بينما تستهلك 4 ميجاوات فقط من الطاقة.
في معيار GPT-3 الذي يحتوي على 175 مليار معلمة، تقول Nvidia إن أداء GB200 أفضل بـ 7 مرات ويتدرب أسرع بـ 4 مرات من H100. بالإضافة إلى ذلك، قالت Nvidia إنها ستطلق أيضًا لوحة أم للخادم تسمى HGX B200، والتي تعتمد على استخدام 8 وحدات معالجة رسوميات B200 ووحدة معالجة مركزية x86 (ربما وحدتي معالجة مركزية) في عقدة خادم واحدة. كل وحدة معالجة رسوميات B200 قابلة للتهيئة لما يصل إلى 1000 واط، وتوفر وحدات معالجة الرسومات ما يصل إلى 18 بيتافلوب من إنتاجية FP4، مما يجعلها أبطأ بنسبة 10% من وحدات معالجة الرسومات في GB200.
في الوقت الحالي، يمكن لعملاء المؤسسات الوصول إلى B200 من خلال HGX B200 وGB200، اللذين يجمعان وحدة معالجة الرسومات B200 مع وحدة المعالجة المركزية Grace CPU من NVIDIA.
2. الترقية الشاملة لخدمات البرامج
يشهد السوق احتدامًا، وتتزايد حدة المنافسة في كل من الأجهزة والبرامج. في مؤتمر GTC هذا، لا تخوض Nvidia المنافسة من خلال ابتكارات الأجهزة الجديدة فحسب، بل تُظهر أيضًا كيف تساعد استراتيجية برمجيات الذكاء الاصطناعي الخاصة بها في تحديد ريادتها في هذا المجال وكيف ستتطور في السنوات القادمة.
تركز Huang Renxun أيضًا على الترويج لحزمة خدمة الاشتراك في برامج الذكاء الاصطناعي الخاصة بها، ومن الواضح أن هذا يتماشى مع إستراتيجية الشركة الجديدة المتمثلة في "بيع الأجهزة مع البرامج" ويختلف أيضًا تمامًا عن الإستراتيجية السابقة المتمثلة في "بيع الأجهزة البرمجيات مع الأجهزة". وداعا.
تتمتع شركة Nvidia بإمكانية الوصول إلى عدد كبير من النماذج في جميع المجالات، لكنها تعتقد أنه لا يزال من الصعب جدًا على المؤسسات استخدامها. أطلقوا Nvidia Inference Microservices (NIM)، التي تعمل على دمج النماذج والتبعيات في حزمة موجزة، مُحسّنة لمكدس المستخدم ومتصلة بواجهة برمجة تطبيقات سهلة الاستخدام.
يمكن تثبيت النموذج المعبأ والمحسن المُدرب مسبقًا على NVIDIA Run، والذي يحتوي على كافة البرامج اللازمة لتشغيله. مكتبات CUDA وواجهات برمجة التطبيقات (APIs) وما إلى ذلك هي في الأساس حزم ذكاء اصطناعي مُحسَّنة لوحدات معالجة الرسومات NV مع واجهة برمجة تطبيقات بسيطة للوصول إليها.
وأشار لاو هوانغ: "هذه هي الطريقة التي سنكتب بها البرامج في المستقبل" - من خلال تجميع مجموعة من الذكاء الاصطناعي.
قدم Lao Huang كيف تستخدم NVIDIA خدمات NVIDIA Inference Microservices (NIM) لإنشاء نظام داخلي تم تصميم chatbot لمعالجة الأسئلة الشائعة التي تتم مواجهتها عند بناء الرقائق. قال: "كنا بحاجة إلى محرك محاكاة لتمثيل العالم رقميًا للروبوت"، وهذا ما كانت عليه شركة Omniverse. ستسمح هذه "الخدمات الصغيرة" للمطورين بإنشاء ونشر "مساعدي الطيارين" أو مساعدي الذكاء الاصطناعي بسرعة باستخدام نماذج خاصة ومخصصة.
وقال إن الروبوتات هي ركيزة أساسية لـ Nvidia، إلى جانب الذكاء الاصطناعي وعمل Ominverse/Digital Twin، وكلها تعمل معًا لتحقيق أقصى استفادة من أنظمة الشركة.
يُذكر أن Omniverse عبارة عن منصة مصممة لبناء وتشغيل تطبيقات Metaverse، وهي في الأساس عوالم افتراضية مشتركة حيث يمكن للأشخاص التفاعل والعمل والإبداع. تتيح منصة Omniverse إنشاء توائم رقمية وعمليات محاكاة متقدمة. تتضمن رؤية NVIDIA لـ Omniverse أن تصبح منصة أساسية لـ Metaverse، حيث يمكن للمبدعين والشركات التعاون في مساحة افتراضية مشتركة. يمكن استخدام التوائم الرقمية التي تم إنشاؤها في Omniverse في مجموعة متنوعة من التطبيقات في Metaverse، مثل التدريب الافتراضي وتصميم المنتج والصيانة التنبؤية.
وقال لاو هوانغ إن شركة NVIDIA أطلقت العشرات من خدمات الذكاء الاصطناعي الصغيرة التوليدية على مستوى المؤسسات، ويمكن للشركات استخدام هذه الخدمات لإنشاء تطبيقات على منصاتها الخاصة مع الاحتفاظ بالملكية الكاملة والتحكم في حقوق الملكية الفكرية الخاصة بها.
أعلن Lao Huang أيضًا عن بث Omniverse Cloud إلى سماعات الرأس Apple Vision Pro.
وقال أيضًا إن NVIDIA تفكر جديًا في إعادة تصميم الطبقة السفلية بأكملها بشكل أساسي. تأمل مجموعة البرامج في استخدام قوة الذكاء الاصطناعي لإنشاء تعليمات برمجية أفضل للبشر.
سبب هذه الفكرة بسيط للغاية: لعقود من الزمن، كان العالم خاضعًا لإطار الحوسبة التقليدية الذي تم تطويره حول وحدات المعالجة المركزية (CPUs)، حيث يكتب البشر تطبيقات لاسترداد البيانات المعدة من قواعد البيانات والمعلومات.
وأشار هوانغ رينكسون في المؤتمر الصحفي إلى أن "أسلوب الحوسبة لدينا اليوم يتطلب أولاً تحديد من كتب وأنشأ المعلومات، مما يعني أنه يجب تسجيل المعلومات أولاً."
إنفيديا لقد فتحت وحدات معالجة الرسومات طريقًا جديدًا للحوسبة الخوارزمية لتسريع الحوسبة، ويمكنها الاعتماد على التفكير الإبداعي (بدلاً من المنطق المتأصل) لتحديد النتائج ذات الصلة.
بالإضافة إلى ذلك، تأمل Nvidia في تعزيز تطوير الروبوتات البشرية من خلال إطلاق مجموعة API جديدة أخرى، وهي Project GROOT.
مشروع GROOT هو نموذج روبوت بشري تنتجه Nvidia بالتعاون مع Jetson Thor، وهو SoC وهو أيضًا نسخة مطورة من Nvidia Isaac. تقول NVIDIA إن الروبوت GROOT سوف يفهم اللغة الطبيعية ويتعلم البراعة من خلال تقليد الحركات البشرية. يدير Jetson Thor وحدة معالجة الرسومات المستندة إلى Blackwell والتي توفر 800 تيرافلوب من أداء الذكاء الاصطناعي عند معالجة البيانات 8 بت.
كشف لاو هوانغ أن الروبوتات التي تقودها المنصة سيتم تصميمها لفهم اللغة الطبيعية وتقليد حركات الروبوت ومراقبة السلوك البشري. يتيح ذلك لروبوتات GROOT أن تتعلم بسرعة التنسيق والبراعة والمهارات الأخرى للتنقل والتكيف والتفاعل مع العالم الحقيقي - وبدون التسبب في تمرد الروبوت على الإطلاق.
قال لاو هوانغ: "يعد بناء نموذج أساسي لروبوت عالمي يشبه الإنسان أحد أكثر المشكلات إثارة التي يمكننا حلها في مجال الذكاء الاصطناعي اليوم". "تجتمع هذه التقنيات التمكينية معًا لتمكين كبار خبراء الروبوتات حول العالم من تحقيق قفزات هائلة في الروبوتات الاصطناعية ذات الأغراض العامة."
3. التأثير على المطورين
وفقًا لتوقعات الخبراء أنه في غضون خمس سنوات، سيتم إدخال المعلومات في شكل نصوص وصور ومقاطع فيديو وكلام في نماذج اللغات الكبيرة (LLM) في الوقت الفعلي. بحلول ذلك الوقت، سيكون لدى أجهزة الكمبيوتر إمكانية الوصول المباشر إلى جميع مصادر المعلومات وستعمل على تحسين نفسها بشكل مستمر من خلال التفاعلات متعددة الوسائط.
قال Huang Renxun: "في المستقبل، سندخل عصر التعلم المستمر. يمكننا أن نقرر ما إذا كنا سننشر نتائج التعلم المستمر، ولن يعتمد التفاعل مع الكمبيوتر بعد الآن على C++. "
هذا هو ما تدور حوله تقنية الذكاء الاصطناعي - يمكن للبشر، بعد التفكير، أن يطلبوا من الكمبيوتر إنشاء تعليمات برمجية لتحقيق هدف محدد. بمعنى آخر، في المستقبل، سيتمكن الأشخاص من التواصل بسلاسة مع أجهزة الكمبيوتر باستخدام لغات بسيطة بدلاً من C++ أو Python.
"في رأيي، فإن قيمة البرمجة نفسها تعبر بهدوء نقطة التحول التاريخية للانحدار". وأضاف هوانغ رينكسون أيضًا أن الذكاء الاصطناعي يعمل بالفعل على سد الفجوة بين البشر والتكنولوجيا.
"في الوقت الحالي، هناك حوالي عشرات الملايين من الأشخاص الذين يعتمدون على معرفتهم ببرمجة الكمبيوتر للعثور على وظائف وكسب الدخل، في حين أن الباقين البالغ عددهم 8 مليارات شخص ما زالوا متخلفين عن الركب. الوضع المستقبلي سيكون هناك تغييرات. " "
من وجهة نظر هوانغ رينكسون، ستصبح اللغة الإنجليزية أقوى لغة برمجة، ويعد التفاعل الشخصي عاملاً رئيسياً في تضييق الفجوة التكنولوجية.
سيصبح الذكاء الاصطناعي التوليدي نظام تشغيل على المستوى الكلي حيث يمكن للبشر توجيه أجهزة الكمبيوتر لإنشاء تطبيقات باستخدام لغة بسيطة. وقال هوانغ رينكسون إن النماذج اللغوية الكبيرة ستساعد البشر على تحويل إلهامهم إلى واقع من خلال أجهزة الكمبيوتر.
على سبيل المثال، يمكن للبشر بالفعل أن يطلبوا من اللغات الكبيرة إنشاء كود بايثون للتطبيقات الخاصة بالمجال، مع كتابة جميع المطالبات باللغة الإنجليزية البسيطة.
"كيف نجعل الكمبيوتر يفعل ما نريد؟ كيف نضبط التعليمات على الكمبيوتر؟ الإجابة على هذه الأسئلة هي هندسة الكلمات السريعة، وهي فن أكثر من كونها فنًا". التكنولوجيا النقية."
وبعبارة أخرى، سيتمكن البشر من التركيز على الخبرة في المجال، في حين سيعوض الذكاء الاصطناعي التوليدي أوجه القصور في مهارات البرمجة. يعتقد Huang Renxun أن هذا سيؤدي إلى تقويض مشهد تطوير البرمجيات تمامًا.
سبق أن قارن هوانغ رينكسون نماذج اللغات الكبيرة بخريجي الجامعات الذين تم تدريبهم مسبقًا وذوي العقول اللامعة. تقدم NVIDIA الخبرة في مجالات مثل الرعاية الصحية والتمويل حول نماذج كبيرة لتوفير دعم فعال لعملاء المؤسسات.