المؤلف: فايمار
الموهبة والطاقة، إنها أصبح برج المرتفعات الذي لا بد من الفوز به في معركة الذكاء الاصطناعي لشركات التكنولوجيا.
"إن حرب مواهب الذكاء الاصطناعي هذه هي حرب المواهب الأكثر جنونًا التي رأيتها على الإطلاق!" يدفع " ماسك " بشكل خاص إلى التحدث علنًا.
في 28 مايو، أعلنت شركة xAI، وهي شركة ناشئة تعمل في مجال الذكاء الاصطناعي أسسها الرئيس التنفيذي لشركة Tesla، على موقعها الرسمي على الإنترنت أنها جمعت 6 مليارات دولار أمريكي لبناء كمبيوتر خارق، يطلق عليها ماسك اسم "مصانع الحوسبة الفائقة". صحيح أن هذا يتطلب المزيد من المواهب. حتى أن " ماسك " قال إنه إذا لم تقدم شركة xAI عرضًا، فسيتم اصطياد الأشخاص بواسطة Open AI.
في هذه المعركة الكبيرة لنموذج الذكاء الاصطناعي حيث لا يستطيع أحد رؤية الشكل الدقيق للمستقبل، من الواضح أن الاستثمار في فريق موثوق به يعد خيارًا جيدًا للشركات الاستثمارية. أقوى ضمان . وهذا أيضًا سبب مهم لتكثيف الحرب من أجل المواهب.
ومع ذلك،"المواهب الجيدة حقًا لا تأخذ زمام المبادرة للبحث عن وظائف، لذلك تحتاج إلى اصطياد تلك المواهب التي تشعر بالتفاؤل بشأنها. " ذكر مؤسس OpenAI سام ألتمان ذلك في مقالته في السنوات الأولى.
فجوة المعلومات هي مفتاح الفوز أو الخسارة في هذه الحرب من أجل المواهب.
تركز خريطة المواهب الأولى لدينا على هذا المجال حيث يراهن عمالقة التكنولوجيا بشدة - الذكاء المتجسد.
إذا كان من الصعب التنبؤ بمستقبل حرب الذكاء الاصطناعي هذه، فقد يكون الذكاء المتجسد أحد أشكالها النهائية. حتى أن الرئيس التنفيذي لشركة Nvidia Jensen Huang قال إن الموجة القادمة من الذكاء الاصطناعي ستكون مجسدة في الذكاء.
حاولت شركة Silicon Rabbit فرز خرائط المواهب الاستخباراتية المجسدة للشركات الأمريكية الكبرى، ومدرستي الذكاء الاصطناعي هوانغبو العسكريتين - Google وNvidia، والصينية من بينهم، ربما يمكنك توفير مرجع للقراء الذين يرغبون في بدء عمل تجاري أو الاستثمار فيه.
『1』تم تصنيف إجمالي 114 من قادة الصناعة بناءً على أوراق ومشاريع استخباراتية رئيسية مجسدة من Google و ومن بين هذه الشركات، تمثل شركة جوجل 60%، وشركة NVIDIA 40%، وعدد أكبر من الرجال (90%) وعدد أقل من النساء (10%).
『2』8% من المستوى الأكاديمي للباحثين يضاهي مستوى الأكاديميين في الجامعة الأكاديمية الوطنية للعلوم. 59% من الباحثين ينتمون إلى رتب رفيعة المستوى.
『3』78% من الباحثين حاصلون على أعلى مستوى أكاديمي من الدكتوراه، و18% طلاب دراسات عليا يمثلون 4% فقط.
「4」يمثل الصينيون حوالي 27% من باحثي الذكاء المجسد في Google وNVIDIA.
「5」أرسلت جامعة ستانفورد أبرز قادة الاستخبارات إلى Google وNvidia، تليها CMU ويمثل معهد ماساتشوستس للتكنولوجيا حوالي ثلث المواهب التي ترسلها هذه المدارس الثلاث.
هل تريد معرفة الشرح التفصيلي للبيانات والسيرة الذاتية للرئيس الصيني؟
「1」
شارك إجمالي 248 باحثًا في أبحاث Google وNVIDIA للذكاء المجسد، باستثناء 62 باحثًا لم يكونوا في Google من بين الباحثين الـ 186 المتبقين المسجلين كعلماء، 60% منهم من الصناعة و40% من الأوساط الأكاديمية.
على وجه التحديد، تتمتع Google بقدرات بحث مستقلة أقوى، وقد اعتمدت NVIDIA على موارد البحث في العديد من المدارس العليا. هناك 45 باحثًا جامعيًا يشاركون في أبحاث الروبوتات من NVIDIA، وهو ما يمثل النصف (51٪)؛ وبالمقارنة، فإن النسبة في Google أقل من الثلث (27، 28٪).
『2』
التركيز على الصناعة المواهب ، من بين 114 باحثًا في Google وNVIDIA، ما يقرب من 90٪ هم من الذكور، وحوالي 27٪ صينيون، وحوالي 78٪ يحملون درجة الدكتوراه.
من حيث نسبة الجنس والانتماء العرقي، يختلف Google وNvidia قليلًا. ويبدو أن Google أكثر صداقة مع النساء، حيث انضمت إليه 11 عالمة، بينما انضمت Nvidia إلى عالمتين فقط.
تمتلك نفيديا نسبة أعلى من الصينيين، حيث تبلغ 40%، بينما تبلغ هذه النسبة 20% فقط في جوجل.
『3』
من جامعة ستانفورد إلى Google وقد أرسلت NVIDIA أباطرة الاستخبارات الأكثر تجسيدًا، تليها CMU وMIT، حيث تمثل المدارس الثلاث حوالي ثلث المواهب.
تخريج 114 باحثًا بأعلى الشهادات الأكاديمية المؤهلات هناك إجمالي 51 كلية وجامعة. ومن بينهم، هناك 16 شخصًا في جامعة ستانفورد، و14 شخصًا في جامعة كارنيجي ميلون، و7 أشخاص في معهد ماساتشوستس للتكنولوجيا، وتمثل هذه المدارس الثلاث حوالي الثلث، في حين أن معظم المدارس الأخرى بها طالب واحد فقط.
تأتي الغالبية العظمى من الباحثين من مؤسسات أمريكية، ولكن هناك أيضًا مدرستان في أوروبا كان لهما تأثير كبير في مجال الذكاء المتجسد: الكلية الإمبراطورية لندن وجامعة أكسفورد، وتخرج من هاتين المدرستين 8 باحثين. لقد راكمت جامعة أكسفورد خبرات غنية في التعلم العميق، وبعد أن استحوذت شركة جوجل على شركة DeepMind، تعاونت مع جامعة أكسفورد وقدمت خبراء في مجال التعلم العميق. على سبيل المثال، يضم فريق البحث والتطوير في AlphaGo ثلاثة أساتذة حاليين في جامعة أكسفورد وأربعة باحثين سابقين في جامعة أكسفورد.
「4」
8% المستوى الأكاديمي للباحثين في الصناعة يمكن مقارنته بمستوى الأكاديميين في الأكاديمية الوطنية للعلوم. 59% من الباحثين في الصناعة يشغلون مناصب رفيعة المستوى. القدرة الأكاديمية لباحثي Google أقوى من قدرة NVIDIA.
نستخدم عدد الاستشهادات ومؤشر "h" لقياس المستوى الأكاديمي. مؤشر "h" هو أكبر عدد من الأوراق المنشورة للمؤلف مع نفس عدد الاستشهادات على الأقل (h). على سبيل المثال، مؤشر h لشخص ما هو 20، مما يعني أنه نشر 20 ورقة بحثية تم الاستشهاد بها 20 مرة على الأقل.
بشكل عام، يمكن اعتبار مؤشر h الذي يبلغ 10 أو أعلى مستوى مرتفعًا، ويعتبر مؤشر h الذي يبلغ 18 مستوىً مرتفعًا، والمتطلبات العامة أن تصبح أكاديميًا في الأكاديمية الوطنية للعلوم تبلغ من العمر 45 عامًا فما فوق.
يُظهر مؤشر h لهؤلاء الباحثين في الشركات البالغ عددهم 114 باحثًا مستوى بحثهم القوي جدًا: 89٪ منهم لديهم مؤشر h أكبر من 10، 59 % من الأشخاص لديهم مؤشر h أكبر من 18، و8% من الأشخاص لديهم مؤشر h أكبر من 45.
ستكشف المقارنة الإضافية بين المستويات الأكاديمية لـ Google وNVIDIA أن تأثير الباحثين في Google أعلى بكثير من تأثير NVIDIA. على سبيل المثال، متوسط الاستشهادات لباحثي المؤسسات في Google ومتوسط مؤشر h هو 12,596 و23، في حين أن بيانات NVIDIA هي 6,418 و21.
「5」
Google وNVIDIA غادر حوالي 1/10 من كل من الباحثين في مجال الذكاء المتجسد للانضمام إلى شركات أخرى.
لقد غادر 7 من أصل 70 شخصًا في Google، وهو ما يمثل 10%. تعمل حاليًا في NVIDIA وApple وTesla و1x وOpenAI وFiger AI وغيرها من الشركات، بشكل عام، هناك عدد أقل من المواهب التي تترك Google، والغالبية العظمى من المواهب تعمل في Google DeepMind.
من بينهم، انضم سكوت ريد إلى Google DeepMind في عام 2016 للعمل على نماذج التحكم والتوليد، وانضم لاحقًا إلى NVIDIA ليصبح كبير علماء الأبحاث في فريق GEAR.
ملاحظة: باحثو Google المستقيلون ووجهتهم
لقد غادر أربعة من 44 باحثًا في الذكاء المتجسد في NVIDIA، وهو ما يمثل 9%. ذهب أحدهم إلى Google، وذهب الآخر إلى مؤسسة أبحاث معهد Allen للذكاء الاصطناعي، واختار الاثنان الآخران بدء عمل تجاري.
تشمل الاهتمامات البحثية لإيجور مورداتش التعلم الآلي والروبوتات والأنظمة متعددة الوكلاء. وكان عالم أبحاث في OpenAI وفي جامعة ستانفورد واستوديو بيكسار للرسوم المتحركة. العمل كباحث زائر. ويشارك في تنظيم برنامج OpenAI Scholar Mentoring Program ويعمل كمرشد ومساعد تدريس لـ AI4All، وبرنامج Google CS Research Mentoring Program، وGirls Inc. بعد ترك NVIDIA، عمل كعالم أبحاث في Google DeepMind. لقد نشر ما يقرب من 123 مقالة، وحصل على مؤشر Google Scholar h لـ 51، وتم الاستشهاد به 18,752 مرة.
ملاحظة: الباحثون المستقيلون في NVIDIA ووجهتهم
『6』
بالنسبة للباحثين ذوي المستوى الأكاديمي (مؤشر h أكبر من 45) والذين هم "أكاديميون في الأكاديمية الوطنية للعلوم"، 6 منهم من Google و1 من NVIDIA. وهي (حسب مستوى الفهرس):
Google
Google
نيكولبدور هيس
عالم أبحاث في DeepMind.
نشر ورقة بحثية بعنوان "تعلم نموذج توليدي للصور عن طريق تحليل المظهر والشكل" في عام 2011. في ذلك الوقت، كان يدرس للحصول على درجة الدكتوراه في المعلوماتية العصبية والحسابية حصل على شهادة في علم الأعصاب من جامعة إدنبرة، ويعمل في DeepMind منذ التخرج.
ركزت الأبحاث المبكرة على الرؤية الآلية والتعلم الآلي والرسومات/الواقع المعزز/الألعاب وغيرها من المجالات. وهو حاليًا أستاذ فخري في قسم علوم الكمبيوتر في جامعة كلية لندن الجامعية، المملكة المتحدة.
نشر ما يقرب من 224 مقالة، وحصل على Google Scholar h-index 65، وتم الاستشهاد به 48,917 مرة.
مارتن ريدميلر
عالم أبحاث في DeepMind.
دراسة علوم الكمبيوتر في جامعة كارلسروه (معهد كارلسروه للتكنولوجيا حاليًا) في ألمانيا من عام 1986 إلى عام 1996، وحصل على درجة الدكتوراه. بعد التخرج، قام بالتدريس في الأوساط الأكاديمية أثناء بدء مشروع تجاري.
من عام 2002 إلى عام 2015، عمل أستاذاً في جامعة دورتموند، وجامعة أوسنابروك، وجامعة فرايبورغ، حيث قاد مختبر التعلم الآلي؛ ومن عام 2010 إلى عام 2015، عمل في بازل بألمانيا وأسس شركة Cognit - Lab لآلات التعلم.
انضمت إلى Google DeepMind في عام 2015 للعمل بدوام كامل.
تركز مجالات بحثه على الذكاء الاصطناعي، والشبكات العصبية، والتعلم المعزز، وما إلى ذلك. وقد نشر ما يقرب من 188 مقالة، ولديه مؤشر h-index من Google Scholar بقيمة 59، وقد تم الاستشهاد به 84.113 مرة.
فيكاس سيندواني
عالم أبحاث Google DeepMind، يقود فريقًا يركز على حل مشكلات التخطيط والإدراك والتعلم والتحكم في مجال مجموعة أبحاث الروبوتات.
حاصل على درجة الدكتوراه في علوم الكمبيوتر من جامعة شيكاغو ودرجة البكالوريوس في الفيزياء الهندسية من المعهد الهندي للتكنولوجيا (IIT) في بومباي.
كان مسؤولاً عن مجموعة التعلم الآلي في مركز أبحاث IBM T.J Watson فرع نيويورك من عام 2008 إلى عام 2015. انضم إلى Google DeepMind في عام 2015 ويعمل منذ ذلك الحين.
يعمل كعضو في هيئة تحرير "المعاملات المتعلقة بأبحاث التعلم الآلي" (TMLR) و"معاملات IEEE بشأن تحليل الأنماط والذكاء الآلي"؛ عضو في NeurIPS، رئيس منطقة المؤتمر الدولي لتمثيلات التعلم وعضو لجنة البرامج العليا في (ICLR) واكتشاف المعرفة واستخراج البيانات (KDD).
تشمل الاهتمامات البحثية على نطاق واسع الأسس الرياضية الأساسية للتعلم الآلي الإحصائي والتصميم الشامل لبناء أنظمة ذكاء اصطناعي واسعة النطاق وآمنة وصحية. .
فاز بجائزة أفضل ورقة بحثية في مجال عدم اليقين في الذكاء الاصطناعي (UAI-2013) وجائزة IBM Pat Goldberg التذكارية لعام 2014، وتم إدراجه في القائمة المختصرة لنهائيات التخطيط المتميز ICRA-2022 لجائزة الورق وجائزة أفضل ورقة لعمليات الروبوت ICRA-2024.
تم نشر حوالي 137 مقالة، وحصلت على تصنيف Google Scholar h-index 52، وتم الاستشهاد بها 17,150 مرة.
فنسنت فانهوك
عالم متميز في Google DeepMind ومدير أول لقسم الروبوتات، وقد عمل في Google لأكثر من 16 سنة.
حاصل على درجة الدكتوراه في الهندسة الكهربائية من جامعة ستانفورد (1999-2003) ودرجة الهندسة من المدرسة المركزية في باريس.
لقد قاد ذات مرة أبحاث الرؤية والإدراك في Google Brain وكان مسؤولاً عن فريق جودة التعرف على الكلام في Google Voice Search. شارك في تأسيس مؤتمر تعلم الروبوت.
يغطي البحث مجالات متعددة مثل الأنظمة الموزعة والحوسبة المتوازية، والذكاء الآلي، والإدراك الآلي، والروبوتات، ومعالجة الكلام. تم نشر حوالي 64 مقالة، في تصنيف Google Scholar h-index 50، وتم الاستشهاد بها 165,519 مرة.
رايا هادسيل
مدير أول للأبحاث والروبوتات في DeepMind، نائب الرئيس للأبحاث.
انضم منذ عام 2014.
بعد حصوله على درجة البكالوريوس في الدراسات الدينية والفلسفة من كلية ريد (1990-1994)، أكمل دراسات الدكتوراه في جامعة نيويورك مع يان ليكون (2003-2008) ) ، ركزت على التعلم الآلي باستخدام الشبكات العصبية السيامية (التي تسمى غالبًا "الخسارة الثلاثية" اليوم)، وخوارزميات التعرف على الوجه، وأبحاث الروبوتات المتنقلة باستخدام التعلم العميق في البرية. فازت الورقة البحثية "تعلم الرؤية بعيدة المدى للروبوتات على الطرق الوعرة" بجائزة الورقة المتميزة في عام 2009.
عمل كزميل ما بعد الدكتوراه في معهد الروبوتات في جامعة كارنيجي ميلون، حيث عمل مع درو باجنيل ومارتيال هيبرت، ثم كعالم رؤية وأبحاث في جامعة كارنيجي ميلون مجموعة الروبوتات (2009-2014).
بعد الانضمام إلى DeepMind، ركز البحث على بعض التحديات الأساسية في مجال الذكاء العام الاصطناعي، بما في ذلك التعلم المستمر ونقل التعلم والعمق في الروبوتات ومشكلات التحكم والتعلم المعزز. والنماذج العصبية للملاحة. وهو المؤسس ورئيس تحرير مجلة مفتوحة جديدة TMLR، وعضو اللجنة التنفيذية في CoRL، وعضو في مختبر أنظمة التعلم الأوروبية (ELLIS)، وأحد المنظمين المؤسسين لـ NAISys (أنظمة العلوم العصبية والذكاء الاصطناعي). ). عملت كمستشارة لـ CIFAR وعملت كعضو في اللجنة التنفيذية لـ WiML (النساء في التعلم الآلي).
نشر حوالي 107 مقالة، وحصل على Google Scholar h-index 45، وتم الاستشهاد به 36,265 مرة.
نيخيل جي جوشي
المعلومات محدودة حصل على درجة الماجستير في الفيزياء من المعهد الهندي للتكنولوجيا في الهند. دكتوراه في الفيزياء الجزيئية من معهد تاتا للبحوث الأساسية بالهند. انضمت إلى Google Brain عام 2017 للقيام بتطوير البرمجيات، وعملت سابقًا في العديد من الشركات. Google Scholar h-index 45، تم الاستشهاد به 8320 مرة.
NVIDIA
ستان بيرتشفيلد
عالم الأبحاث الرئيسي ومدير الأبحاث الأول في NVIDIA.
انضم في عام 2016، وهو مسؤول بشكل أساسي عن تقاطع رؤية الكمبيوتر والروبوتات، بما في ذلك التعلم والإدراك والواقع والتفاعل بوساطة الذكاء الاصطناعي.
حصل على درجة الدكتوراه في الهندسة الكهربائية من جامعة ستانفورد عام 1999، مع تخصص فرعي في علوم الكمبيوتر.
بعد التخرج، انضم إلى شركة Quindi Corporation الناشئة في منطقة الخليج كمهندس أبحاث لتطوير خوارزميات الصوت والفيديو الرقمية الذكية.
من عام 2013 إلى عام 2016، انضم إلى شركة Microsoft وكان مسؤولاً عن تطوير رؤية الكمبيوتر وتطبيقات الروبوتات وأنظمة الملاحة الحقيقة الأرضية، وقاد تطوير وظائف التبديل التلقائي للكاميرا .
يحتل مؤشر h-index للباحث العلمي من Google المرتبة 56 وتم الاستشهاد به 14,315 مرة.
『7』
بعض أباطرة الأعمال الصينيين في الصناعة
إجمالي 31 من هؤلاء الباحثين البالغ عددهم 114 باحثًا من أصل صيني، مع التركيز على 12 باحثًا بارزًا، بما في ذلك 4 من Google، و6 من Nvidia، و1 من كل من OpenAI و1x .
Google
فاي شيا )
كبير الباحثين العلميين في Google DeepMind.
تخرج من جامعة تسينغهوا عام 2016 وحصل على درجة الدكتوراه من قسم الهندسة الكهربائية بجامعة ستانفورد عام 2021.
أثناء دراستي للدكتوراه، أجريت تدريبًا بحثيًا مع ديتر فوكس من NVIDIA، وألكسندر توشيف، وبريان إيختر من Google. وبعد حصوله على درجة الدكتوراه في جامعة ستانفورد، انضم إلى فريق الروبوتات في جوجل في خريف عام 2021.
تشمل الاهتمامات البحثية عمليات المحاكاة الروبوتية واسعة النطاق والقابلة للتحويل، وخوارزميات التعلم للمهام طويلة المدى، والجمع بين التمثيلات الهندسية والدلالية للبيئات. الاتجاه البحثي الأخير هو استخدام النماذج الأساسية (Foundation Models) في عملية صنع القرار للوكلاء الأذكياء.
تشمل الإنجازات الأكاديمية قبول 5 أوراق في مؤتمر ICRA 2023 و4 أوراق في مؤتمر CoRL 2022.
يشمل العمل التمثيلي GibsonEnv وiGibson وSayCan وما إلى ذلك. وتقوم iGibson بتطوير بيئات تفاعلية واسعة النطاق لتعلم الروبوتات، وتستخدم التعلم والنماذج المقلدة في استراتيجيات التحكم في الروبوت. دمج التحكم التنبؤي (MPC). يبلغ مؤشر Google Scholar h 33 وعدد الاستشهادات 12478.
آندي زينج
عالم أبحاث أول في Google DeepMind.
حصل على درجة البكالوريوس المزدوجة في علوم الكمبيوتر والرياضيات من جامعة كاليفورنيا في بيركلي ودرجة الدكتوراه في علوم الكمبيوتر من جامعة برينستون. بعد تخرجه بدرجة الدكتوراه في عام 2019، انضم إلى Google Brain، مع التركيز على التعلم الآلي والرؤية واللغة وتعلم الروبوت.
تشمل الاهتمامات البحثية التعلم الآلي، وتمكين الآلات من التفاعل بذكاء مع العالم وتحسين نفسها بمرور الوقت.
تشمل الإنجازات الأكاديمية الأبحاث المنشورة في مؤتمرات مختلفة، مثل ICRA، وCVPR، وCoRL، وما إلى ذلك.
من بين المشاريع المهمة التي شارك فيها PaLM-E.
مؤشر h للباحث العلمي من Google هو 32، وعدد الاستشهادات 12,207.
تيانخه يو
عالم أبحاث Google DeepMind.
حصل على درجة البكالوريوس مع مرتبة الشرف الأولى في علوم الكمبيوتر والرياضيات التطبيقية والإحصاء من جامعة كاليفورنيا في بيركلي عام 2017، والدكتوراه في علوم الكمبيوتر من جامعة ستانفورد عام 2022. المرشد هو تشيلسي فين.
بعد تخرجه بدرجة الدكتوراه في عام 2022، سينضم إلى Google Brain ويركز على التعلم الآلي والرؤية واللغة وتعلم الروبوت.
تشمل الاهتمامات البحثية التعلم الآلي، والإدراك، والتحكم، وخاصة التعلم المعزز دون اتصال بالإنترنت (أي التعلم من مجموعات البيانات الثابتة)، والمهام المتعددة والتعلم التلوي. وقد تم مؤخرا استكشاف استخدام النماذج الأساسية في مشاكل صنع القرار.
تشمل الإنجازات الأكاديمية الأبحاث المنشورة في مؤتمرات مختلفة، مثل ICRA، وCVPR، وCoRL، وما إلى ذلك.
من بين المشاريع المهمة التي شارك فيها PaLM-E.
مؤشر h للباحث العلمي من Google هو 25، وعدد الاستشهادات 7726.
يوشيانغ تشو
مهندس أبحاث أول في Google DeepMind.
دراسة الماجستير والدكتوراه في علوم الكمبيوتر في إمبريال كوليدج لندن بالمملكة المتحدة من 2010 إلى 2018 تحت إشراف البروفيسور ستيفانوس زافيريو.
من سبتمبر 2017 إلى مارس 2018، أجريت تدريبًا بحثيًا حول التعلم المعزز العميق والروبوتات في Google Brain & DeepMind، وانضممت في ديسمبر 2018 إلى Google DeepMind كـ مهندس أبحاث.
تشمل موضوعات البحث حل الروبوتات، وتعلم التقليد من منظور الشخص الثالث، وأبحاث الأشكال الكثيفة حول نماذج التشوه الإحصائية، وما إلى ذلك.
مؤشر h للباحث العلمي من Google هو 17، وعدد الاستشهادات 3099.
NVIDIA
Linxi Fan (Fan Linxi )
عالم أبحاث كبير في NVIDIA ورئيس GEAR Lab.
حصل على درجة الدكتوراه من مختبر الرؤية بجامعة ستانفورد، ودرس على يد البروفيسور لي فيفي.
عملت في OpenAI (مع إيليا سوتسكيفر وأندريه كارباثي)، ومختبر Baidu AI (مع أندرو إنج وداريو أمودي)، وMILA (مع يوشوا بنجيو).
يستكشف البحث حدود النماذج الأساسية متعددة الوسائط، والتعلم المعزز، ورؤية الكمبيوتر، والأنظمة واسعة النطاق.
الريادة في إنشاء Voyager (أول وكيل ذكاء اصطناعي يلعب لعبة Minecraft بكفاءة وتوجيه وظائفها بشكل مستمر)، وMineDojo (يتم فتحه من خلال مشاهدة 100,000 مقطع فيديو للعبة Minecraft على YouTube) وتعلم الوكيل )، يوريكا (يد آلية ذات 5 أصابع تؤدي مهامًا بارعة للغاية مثل تدوير القلم)، وVIMA (أحد أقدم النماذج الأساسية متعددة الوسائط لتشغيل الروبوت). فاز MineDojo بجائزة الورق المتميز في NeurIPS 2022.
مؤشر h للباحث العلمي من Google هو 18، وعدد الاستشهادات 5619.
تشن هسوان لين
عالم أبحاث كبير في NVIDIA.
تخرج من جامعة تايوان الوطنية بدرجة البكالوريوس في الهندسة الكهربائية. حصل على درجة الدكتوراه في الروبوتات من جامعة كارنيجي ميلون، تحت إشراف سايمون لوسي وبدعم من زمالة NVIDIA Graduate Fellowship.
تم تدريبه في Facebook AI Research وAdobe Research.
العمل على رؤية الكمبيوتر ورسومات الكمبيوتر وتطبيقات الذكاء الاصطناعي التوليدية. مهتم بحل المشكلات التي تتضمن إنشاء محتوى ثلاثي الأبعاد، بما في ذلك إعادة البناء ثلاثي الأبعاد والعرض العصبي والنماذج التوليدية والمزيد.
فاز البحث بجائزة أفضل اختراع لعام 2023 من مجلة TIME.
مؤشر h للباحث العلمي من Google هو 15، وعدد الاستشهادات 2752.
دي آن هوانغ (黄德安)
عالم أبحاث NVIDIA، متخصص في رؤية الكمبيوتر، والروبوتات، والتعلم الآلي، والمعلوماتية الحيوية.
حصل على درجة الدكتوراه في علوم الكمبيوتر من جامعة ستانفورد، تحت إشراف Fei-Fei Li وخوان كارلوس نيبلز. أثناء حصوله على درجة الماجستير في جامعة كارنيجي ميلون، تعاون مع كريس كيتاني، وأثناء دراسته الجامعية في جامعة تايوان الوطنية، تعاون مع يو تشيانغ فرانك وانغ.
عمل سابقًا كديتر فوكس من مختبر NVIDIA Seattle Robotics، وVignesh Ramanathan وDhruv Mahajan من Facebook Applied Machine Learning، وZicheng Liu من معهد Microsoft Redmond Research Institute ومتدرب لدى Leonid سيجال في معهد ديزني للأبحاث في بيتسبرغ.
مؤشر h للباحث العلمي من Google هو 32، وعدد الاستشهادات 4848.
كايشون مو
NVIDIA عالم أبحاث في مختبر سياتل للروبوتات بقيادة البروفيسور ديتر فوكس.
حصل على درجة الدكتوراه في علوم الكمبيوتر من جامعة ستانفورد، تحت إشراف البروفيسور ليونيداس جي غيباس. وكان سابقًا منتسبًا إلى مجموعة الحوسبة الهندسية ومختبر الذكاء الاصطناعي في جامعة ستانفورد. قبل انضمامه إلى جامعة ستانفورد في عام 2016، حصل على درجة البكالوريوس في علوم الكمبيوتر فئة ACM من جامعة شنغهاي جياو تونغ (ملاحظة: معدل القبول المباشر لفئة مرتبة الشرف في شنغهاي ACM يصل إلى 92٪، وفاز بالبطولة العالمية لـ مسابقة البرمجة للطلاب ACM International College ثلاث مرات وتم تدريب 640 طالبًا في علوم الكمبيوتر "أقوى دماغ"). المعدل التراكمي هو 3.96/4.30 (المرتبة 1/33).
المجالات المهنية هي رؤية الكمبيوتر ثلاثية الأبعاد والرسومات والروبوتات والتعلم العميق ثلاثي الأبعاد، مع التركيز بشكل خاص على التعلم العميق ثلاثي الأبعاد الذي يركز على الكائنات وبنية البيانات المرئية ثلاثية الأبعاد تعلم التمثيل
مؤشر h للباحث العلمي من Google هو 20، وعدد الاستشهادات 17654.
شينشو ونغ
عالم أبحاث NVIDIA، يعمل مع ماركو بافوني.
حصلت على درجة الدكتوراه في الروبوتات (2018-2022) والماجستير في رؤية الكمبيوتر (2016-17) من جامعة كارنيجي ميلون مع كريس كيتاني سنة). تخرج من جامعة ووهان بدرجة البكالوريوس.
عملت أيضًا مع ياسر شيخ من Facebook Reality Lab كمهندسة أبحاث، حيث ساعدت في بناء "حضور عن بعد نابض بالحياة".
تشمل الاهتمامات البحثية النماذج التوليدية للأنظمة المستقلة ورؤية الكمبيوتر ثلاثية الأبعاد. تغطية المهام مثل اكتشاف الهدف، وتتبع الأهداف المتعددة، وإعادة تحديد الهوية، والتنبؤ بالمسار، وتخطيط الحركة. تم تطوير أنظمة تتبع ثلاثية الأبعاد متعددة الكائنات مثل AB3DMOT الذي يحتوي على أكثر من 1300 نجمة على GitHub.
مؤشر h للباحث العلمي من Google هو 23، وعدد الاستشهادات 3472.
Zhiding Yu (Yuzhiding)
كبير علماء الأبحاث وقائد مجموعة أبحاث التعلم الآلي في NVIDIA.
حصل على درجة الدكتوراه في الهندسة الكهربائية وهندسة الكمبيوتر من جامعة كارنيجي ميلون عام 2017، ودرجة الماجستير في الهندسة الكهربائية وهندسة الكمبيوتر من جامعة هونغ كونغ للعلوم والتكنولوجيا في عام 2012 بكالوريوس العلوم. تخرج من الهندسة الكهربائية المشتركة (فصل فنغ بينج تشيوان التجريبي) من جامعة جنوب الصين للتكنولوجيا في عام 2008.
تركز الاهتمامات البحثية بشكل أساسي على التعلم التمثيلي العميق، والتعلم الخاضع للإشراف الضعيف/شبه الإشراف، ونقل التعلم والتنبؤ المنظم العميق، وتطبيقاتها في تطبيق مشاكل الرؤية والروبوتات .
الفائز بمسار التجزئة الدلالية التكيفية للمجال في WAD Challenge@CVPR18. فاز بجائزة أفضل ورقة في WACV15.
مؤشر h للباحث العلمي من Google هو 42، وعدد الاستشهادات 17064.
OpenAI
منغيوان يان
الطاقم الفني.
حصل على درجة البكالوريوس في الفيزياء من جامعة بكين عام 2014 والدكتوراه في الهندسة الإلكترونية والكهربائية من جامعة ستانفورد عام 2020.
عضو في مختبر الإدراك التفاعلي وتعلم الروبوتات (IPRL)، وهو جزء من مختبر ستانفورد للذكاء الاصطناعي، تحت إشراف جانيت بوهج وليونداس غيباس.
تشمل مجالات البحث رؤية الكمبيوتر والتعلم الآلي والروبوتات والنماذج التوليدية.
تم نشر ما مجموعه 28 مقالة، مع مؤشر h-index من Google الذي يبلغ 15 واستشهادات 4664 مرة.
1X التقنيات
إيريك جانغ< /strong>
نائب الرئيس لمنظمة العفو الدولية.
تخرجت من جامعة براون بدرجة الماجستير عام 2016، تخصص علوم الكمبيوتر.
عملت في Google من عام 2016 إلى 2022 كعالم أبحاث كبير في مجال الروبوتات،
الأبحاث ركز على تطبيق مبادئ التعلم الآلي في مجال الروبوتات، وقام بتطوير Tensor2Robot، وإطار تعلم الآلة الذي يستخدمه فريق عمليات الروبوت و Everyday Robots (حتى تم إهمال TensorFlow 1)، وكان قائدًا مشاركًا لفريق Brain Moonshot الذي أنتج SayCan.
غادر Google Robotics في أبريل 2022 وانضم إلى 1X Technologies (المعروفة سابقًا باسم Halodi Robotics)، مما قاد الفريق إلى إكمال مهمتين مهمتين، إحداهما من البداية -النهاية العصبية تدرك الشبكة استقلالية الروبوت البشري EVE.
المؤلف الأول لـ 7 أوراق بحثية، مع أكثر من 15 مؤلفًا مشاركًا، ومؤشر Google Scholar h-Index يبلغ 23، واستشهادات 11,213. ألف كتابًا بعنوان "الذكاء الاصطناعي مفيد لك" عن تاريخ الذكاء الاصطناعي ومستقبله.
『8』
قفل Google وGoogle من خلال الأوراق البحثية الرئيسية والتجارب التجريبية مشاريع المواهب الاستخباراتية المتجسدة في NVIDIA.
تركز Google على أبحاث النماذج الأساسية، وتتضمن إصداراتها البحثية الرئيسية التي تتضمن مواهب الذكاء المجسدة ما يلي:
SayCan: قادر على تقسيم المهام عالية المستوى إلى مهام فرعية قابلة للتنفيذ.
Gato: قم بترميز البيانات متعددة الوسائط وإدخالها في بنية المحولات.
RT-1: أدخل بيانات مسار الروبوت في بنية المحول للحصول على رمز الإجراء المميز.
PaLM-E: استنادًا إلى النموذج العام PaLM، تم تحسين الأداء متعدد الوسائط بشكل أكبر.
RoboCat: من خلال الجمع بين نموذج Gato متعدد الوسائط ومجموعة بيانات الروبوت، فإن RoboCat قادر على معالجة اللغة والصور والإجراءات في البيئات المحاكاة والبيئات المادية. قدرة.
RT-2: هو مزيج من نموذج RT-1 ونموذج PaLM-E، مما يمكّن نموذج الروبوت من التطور من VLM إلى VLA.
RT-X: مع الحفاظ على البنية الأصلية، فإنه يعمل بشكل شامل على تحسين القدرات الخمس للذكاء المتجسد.
لقد أدركت النماذج المذكورة أعلاه تدريجيًا الجمع بين نموذج اتخاذ القرار المستقل والموثوق والإدراك متعدد الوسائط وقدرات التشغيل والتحكم الدقيقة في الوقت الفعلي، مع إظهار قدرات التعميم وقدرات سلسلة التفكير.
استنادًا إلى الأوراق البحثية المذكورة أعلاه، تم تصنيف إجمالي 143 باحثًا في Google.
تركز NVIDIA على التدريب على المحاكاة، وتشمل المشاريع التجريبية التي تشارك فيها مواهبها الذكية المجسدة ما يلي:
يوريكا: تصميم آلية المكافأة لتعزيز التعلم باستخدام نماذج لغوية كبيرة
Voyager: استخدام نماذج لغوية كبيرة لدفع الذكاء جسم العالم المفتوح
اللعب التقليد: التعلم بالتقليد عن بعد من خلال ملاحظة تصرفات الإنسان
VIMA : التحكم في الأوامر المتطور متعدد الوسائط لأداء مهام الروبوت العالمية
MinDojo: استخدام البيانات على نطاق الإنترنت لبناء ذكاء مجسد مفتوح
بالإضافة إلى ذلك، ستركز NVIDIA على الذكاء المتجسد في عام 2024، وأعلنت رسميًا عن إنشاء مختبر GEAR (أبحاث الوكيل العام المتجسد)، والذي سيركز بشكل أساسي على الوسائط المتعددة النماذج الأساسية، وأبحاث الروبوت العامة، والعوالم الافتراضية يتم إجراء الأبحاث في أربعة مجالات رئيسية: العوامل الأساسية وتقنيات المحاكاة والبيانات الاصطناعية، بهدف تعزيز تطوير تقنيات الذكاء الاصطناعي مثل النماذج الكبيرة من العالم الافتراضي إلى العالم الحقيقي.
تقوم هذه المقالة أولاً بفرز إجمالي 7 أوراق بحثية أساسية لمشروع Google مذكورة أعلاه. تسرد كل ورقة الباحثين في المشروع بالتفصيل وتعلن بوضوح عن محتوى عملهم المحدد.
أعلنت صفحة أبحاث NVIDIA عن قائمة الأشخاص المشاركين في مشروع الروبوتات، بإجمالي 54 شخصًا بالإضافة إلى ذلك، مع الأخذ في الاعتبار جميع مؤلفي الأوراق البحثية التي نشرتها GEAR، تم فرز ما مجموعه 105 أشخاص محددين.
ملحق: قائمة تضم 100 شخص يتمتعون بذكاء متجسد من Google وNVIDIA
< /ص>