Tác giả: Weimar
Tài năng và nghị lực, Nó đang trở thành tòa tháp vùng cao không thể thiếu trong cuộc chiến AI của các hãng công nghệ.
“Cuộc chiến nhân tài AI này là cuộc chiến nhân tài điên rồ nhất mà tôi từng thấy!”Musk đang thúc đẩy Đặc biệt lên tiếng.
Vào ngày 28 tháng 5, xAI, một công ty khởi nghiệp về AI do CEO Tesla thành lập, đã thông báo trên trang web chính thức rằng họ đã huy động được 6 tỷ USD để xây dựng một siêu máy tính, Musk gọi chúng là “những nhà máy siêu máy tính”. Đúng là điều này đòi hỏi nhiều tài năng hơn. Musk thậm chí còn nói rằng nếu xAI không đưa ra lời đề nghị, mọi người sẽ bị Open AI săn lùng.
Trong cuộc chiến mô hình trí tuệ nhân tạo lớn này, nơi không ai có thể nhìn thấy hình dạng chính xác của tương lai, đầu tư vào một đội ngũ đáng tin cậy rõ ràng là một lựa chọn tốt cho các công ty đầu tư. Sự đảm bảo mạnh mẽ nhất. Đây cũng là nguyên nhân quan trọng khiến cuộc chiến tranh giành nhân tài ngày càng gay gắt.
Tuy nhiên,"Những tài năng thực sự giỏi thường không chủ động tìm kiếm việc làm, vì vậy bạn cần chiêu mộ những tài năng mà bạn lạc quan. " Người sáng lập OpenAI Sam Altman đã đề cập đến nó trong bài viết của mình vào những năm đầu.
Khoảng cách thông tin chính là chìa khóa quyết định thắng thua trong cuộc chiến tranh giành nhân tài này.
Bản đồ nhân tài đầu tiên của chúng tôi tập trung vào lĩnh vực này, nơi những gã khổng lồ công nghệ đang đặt cược rất nhiều - trí thông minh thể hiện.
Nếu tương lai của cuộc chiến AI này khó dự đoán, thì trí thông minh thể hiện có thể là một trong những hình thức tối thượng của nó. Giám đốc điều hành Nvidia Jensen Huang thậm chí còn nói rằng làn sóng AI tiếp theo sẽ là hiện thân của trí thông minh.
Silicon Rabbit đã cố gắng sắp xếp các bản đồ tài năng tình báo thể hiện của các công ty lớn của Mỹ, hai Trường quân sự AI Hoàng Phố - Google và Nvidia, và Trung Quốc trong số đó, thưa ông, có thể ông có thể cung cấp tài liệu tham khảo cho những độc giả muốn khởi nghiệp hoặc đầu tư vào đó.
『1』Tổng cộng 114 nhà lãnh đạo ngành đã được chọn dựa trên các tài liệu và dự án tình báo quan trọng từ Google và Trong số đó, Google chiếm 60%, NVIDIA 40%, nam giới nhiều hơn (90%) và nữ ít hơn (10%).
『2』8% trình độ học vấn của các nhà nghiên cứu tương đương với trình độ học vấn của các học giả của Viện Hàn lâm Khoa học Quốc gia. 59% nhà nghiên cứu thuộc cấp bậc cao.
『3』78% nhà nghiên cứu có trình độ học vấn cao nhất là Tiến sĩ, và 18% là sinh viên đại học chỉ chiếm 4%.
「4」Người Trung Quốc chiếm khoảng 27% trong số các nhà nghiên cứu tình báo của Google và NVIDIA.
「5」Stanford đã cử những nhà lãnh đạo tình báo tiêu biểu nhất đến Google và Nvidia, tiếp theo là CMU và MIT chiếm khoảng 1/3 số nhân tài được ba trường này gửi đến.
Muốn biết giải thích chi tiết về dữ liệu và lý lịch của ông chủ Trung Quốc?
「1」
Tổng cộng có 248 nhà nghiên cứu đã tham gia vào nghiên cứu trí tuệ thể hiện của Google và NVIDIA, không bao gồm 62 nhà nghiên cứu không ở Google Trong số 186 nhà nghiên cứu còn lại đã đăng ký là Học giả, 60% đến từ ngành công nghiệp và 40% đến từ giới học thuật.
Đặc biệt, Google có khả năng nghiên cứu độc lập mạnh mẽ hơn và NVIDIA đã tận dụng nguồn lực nghiên cứu của nhiều trường hàng đầu. Có 45 nhà nghiên cứu đại học tham gia nghiên cứu robot của NVIDIA, chiếm một nửa (51%); so với Google, tỷ lệ này chưa đến một phần ba (27, 28%).
『2』
Tập trung vào ngành nhân tài, trong số 114 nhà nghiên cứu tại Google và NVIDIA, có khoảng 90% là nam giới, khoảng 27% là người Trung Quốc và khoảng 78% có bằng tiến sĩ.
Xét về tỷ lệ giới tính và dân tộc, Google và Nvidia hơi khác nhau. Google có vẻ thân thiện hơn với phụ nữ, có 11 nhà khoa học nữ tham gia, trong khi Nvidia chỉ có 2.
Nvidia có tỷ lệ người Trung Quốc cao hơn, chiếm tới 40%, trong khi tỷ lệ này ở Google chỉ là 20%.
『3』
Stanford tới Google và NVIDIA đã cử những ông trùm tình báo xuất sắc nhất, tiếp theo là CMU và MIT, với ba trường chiếm khoảng 1/3 nhân tài.
114 nhà nghiên cứu đã tốt nghiệp với thành tích học tập cao nhất trình độ chuyên môn Có tổng cộng 51 trường cao đẳng và đại học. Trong số đó, có 16 người ở Đại học Stanford, 14 người ở Đại học Carnegie Mellon và 7 người ở MIT. Ba trường này chiếm khoảng 1/3, trong khi hầu hết các trường khác chỉ có một sinh viên.
Phần lớn các nhà nghiên cứu đến từ các tổ chức của Mỹ, nhưng cũng có hai trường ở Châu Âu có tác động lớn đến lĩnh vực trí tuệ thể hiện: Imperial College London và Đại học Oxford, tổng cộng có 8 nhà nghiên cứu tốt nghiệp từ hai trường này. Đại học Oxford đã tích lũy được kinh nghiệm phong phú về học sâu và sau khi Google mua lại DeepMind, họ đã hợp tác với Đại học Oxford và giới thiệu các chuyên gia trong lĩnh vực học sâu. Ví dụ: nhóm R&D của AlphaGo bao gồm ba giáo sư hiện tại của Đại học Oxford và bốn nhà nghiên cứu trước đây của Đại học Oxford.
「4」
8% trình độ học vấn của các nhà nghiên cứu trong ngành tương đương với trình độ học thuật của các học giả của Viện Hàn lâm Khoa học Quốc gia. 59% cán bộ nghiên cứu trong ngành thuộc các vị trí cấp cao. Khả năng học thuật của các nhà nghiên cứu Google mạnh hơn NVIDIA.
Chúng tôi sử dụng số lượng trích dẫn và chỉ số "h" để đo lường trình độ học thuật. Chỉ số “h” là số lượng bài báo được xuất bản cao nhất của một tác giả có ít nhất cùng số lượng trích dẫn (h). Ví dụ: chỉ số h của một người là 20, nghĩa là anh ta đã xuất bản 20 bài báo được trích dẫn ít nhất 20 lần.
Nói chung, chỉ số h từ 10 trở lên có thể được coi là cấp cao, chỉ số h từ 18 là cấp cao và các yêu cầu chung trở thành viện sĩ Viện Hàn lâm Khoa học Quốc gia là từ 45 tuổi trở lên.
Chỉ số h của 114 nhà nghiên cứu doanh nghiệp này cho thấy trình độ nghiên cứu rất mạnh của họ: 89% trong số họ có chỉ số h lớn hơn 10, 59 % số người có chỉ số h lớn hơn 18 và 8% số người có chỉ số h thậm chí trên 45.
So sánh sâu hơn về trình độ học thuật của Google và NVIDIA sẽ cho thấy tầm ảnh hưởng của các nhà nghiên cứu Google cao hơn đáng kể so với NVIDIA. Ví dụ: trích dẫn nhà nghiên cứu doanh nghiệp trung bình của Google và chỉ số h trung bình là 12.596 và 23, trong khi dữ liệu của NVIDIA là 6.418 và 21.
「5」
Google và NVIDIA Khoảng 1/10 trong số các nhà nghiên cứu tình báo hiện thân đã rời đi để gia nhập các công ty khác.
7 trong số 70 người ở Google đã rời đi, chiếm 10%. Hiện đang làm việc tại NVIDIA, Apple, Tesla, 1x, OpenAI, Hình AI và các công ty khác, nói chung, có ít nhân tài rời Google hơn và đại đa số nhân tài làm việc trong Google DeepMind.
Trong số đó, Scott Reed đã gia nhập Google DeepMind vào năm 2016 để nghiên cứu các mô hình điều khiển và tạo ra, sau đó gia nhập NVIDIA để trở thành nhà khoa học nghiên cứu chính của nhóm GEAR.
Lưu ý: Các nhà nghiên cứu đã nghỉ việc của Google và đích đến của họ
Bốn trong số 44 nhà nghiên cứu trí tuệ tiêu biểu của NVIDIA đã rời đi, chiếm 9%. Một người đến Google, một người vào viện nghiên cứu AI của Viện Allen, và hai người còn lại chọn khởi nghiệp.
Mối quan tâm nghiên cứu của Igor Mordatch bao gồm học máy, robot và hệ thống đa tác nhân. Ông từng là nhà khoa học nghiên cứu tại OpenAI, Đại học Stanford và Pixar Animation Studio. Phục vụ như một nhà nghiên cứu đến thăm. Anh đồng tổ chức Chương trình cố vấn học giả OpenAI và đóng vai trò cố vấn và trợ lý giảng dạy cho AI4All, Chương trình cố vấn nghiên cứu Google CS và Girls Inc. Sau khi rời NVIDIA, anh làm nhà khoa học nghiên cứu tại Google DeepMind. Ông đã xuất bản khoảng 123 bài báo, có chỉ số h của Google Scholar là 51 và đã được trích dẫn 18.752 lần.
Lưu ý: Các nhà nghiên cứu đã nghỉ việc của NVIDIA và đích đến của họ
『6』
Đối với các nhà nghiên cứu có trình độ học vấn (chỉ số h lớn hơn 45) là "Học giả của Viện Hàn lâm Khoa học Quốc gia", 6 người đến từ Google và 1 đến từ NVIDIA. Đó là (theo cấp độ chỉ mục):
Google
Nicolvai Heess
Nhà khoa học nghiên cứu DeepMind.
Xuất bản bài báo "Tìm hiểu mô hình tạo hình ảnh bằng cách phân tích hình thức và hình dạng" vào năm 2011. Khi đó, anh đang học tiến sĩ về tin học thần kinh và tính toán khoa học thần kinh tại Đại học Edinburgh và đã làm việc tại DeepMind kể từ khi tốt nghiệp.
Nghiên cứu ban đầu tập trung vào thị giác máy, học máy, đồ họa/thực tế tăng cường/trò chơi và các lĩnh vực khác. Ông hiện là giáo sư danh dự tại Khoa Khoa học Máy tính tại trường. UCL, Vương quốc Anh.
Đã xuất bản khoảng 224 bài viết, chỉ số h của Google Scholar là 65 và được trích dẫn 48.917 lần.
Martin Riedmiller
Nhà khoa học nghiên cứu DeepMind.
Học ngành khoa học máy tính tại Đại học Karlsruhe (nay là Viện Công nghệ Karlsruhe) ở Đức từ năm 1986 đến năm 1996 và nhận bằng Tiến sĩ. Sau khi tốt nghiệp, ông vừa giảng dạy vừa bắt đầu kinh doanh.
Từ năm 2002 đến năm 2015, ông giữ chức vụ giáo sư tại Đại học Dortmund, Đại học Osnabrueck và Đại học Freiburg, lãnh đạo Phòng thí nghiệm Học máy; từ năm 2010 đến 2015, anh làm việc tại Basel, Đức. Den thành lập Cognit - Lab dành cho máy học.
Tham gia Google DeepMind vào năm 2015 để làm việc toàn thời gian.
Các lĩnh vực nghiên cứu của ông tập trung vào trí tuệ nhân tạo, mạng lưới thần kinh, học tăng cường, v.v. Ông đã xuất bản khoảng 188 bài báo, có chỉ số h của Google Scholar là 59, và đã được trích dẫn 84.113 lần.
Vikas Sindhwani
Nhà khoa học nghiên cứu Google DeepMind, dẫn đầu một nhóm tập trung vào giải quyết các vấn đề về lập kế hoạch, nhận thức, học tập và kiểm soát trong thế giới lĩnh vực của nhóm nghiên cứu robot.
Ông có bằng Tiến sĩ về khoa học máy tính tại Đại học Chicago và bằng cử nhân về vật lý kỹ thuật của Viện Công nghệ Ấn Độ (IIT) Bombay.
Ông phụ trách nhóm học máy tại Trung tâm Nghiên cứu IBM T.J. Watson Chi nhánh New York từ năm 2008 đến năm 2015. Gia nhập Google DeepMind vào năm 2015 và làm việc kể từ đó.
Là thành viên ban biên tập của "Giao dịch trên Nghiên cứu Học máy" (TMLR) và "Giao dịch IEEE về Phân tích Mẫu và Trí tuệ Máy"; thành viên của NeurIPS, Hội nghị quốc tế về Chủ tịch khu vực đại diện học tập và Thành viên Ủy ban chương trình cấp cao của (ICLR) và Khám phá kiến thức và khai thác dữ liệu (KDD).
Các mối quan tâm nghiên cứu nói chung liên quan đến nền tảng toán học cốt lõi của học máy thống kê và thiết kế toàn diện để xây dựng các hệ thống trí tuệ nhân tạo quy mô lớn, an toàn và lành mạnh .
Giành được Giải thưởng Bài báo hay nhất về Sự không chắc chắn trong Trí tuệ Nhân tạo (UAI-2013) và Giải thưởng Tưởng niệm Pat Goldberg của IBM năm 2014 và được lọt vào danh sách Chung kết Kế hoạch Xuất sắc của ICRA-2022; cho Giải thưởng Giấy và Giải thưởng Giấy xuất sắc nhất về Hoạt động Robot của ICRA-2024.
Đã xuất bản khoảng 137 bài viết, chỉ số h-index của Google Scholar là 52 và được trích dẫn 17.150 lần.
Vincent Vanhoucke
Nhà khoa học xuất sắc tại Google DeepMind và là giám đốc cấp cao của bộ phận robot, ông đã làm việc tại Google hơn 16 năm.
Có bằng Tiến sĩ về kỹ thuật điện của Đại học Stanford (1999-2003) và bằng kỹ sư của Ecole Centrale ở Paris.
Ông từng lãnh đạo nghiên cứu về tầm nhìn và nhận thức của Google Brain và chịu trách nhiệm về nhóm chất lượng nhận dạng giọng nói của Google Voice Search. Đồng sáng lập Hội nghị về Robot Learning.
Nghiên cứu bao gồm nhiều lĩnh vực như hệ thống phân tán và điện toán song song, trí tuệ máy, nhận thức máy, robot và xử lý giọng nói. Đã xuất bản khoảng 64 bài viết, Google Scholar h-index 50 và được trích dẫn 165.519 lần.
Raia Hadsell
Giám đốc cấp cao về Nghiên cứu và Robot tại DeepMind, Phó Giám đốc Nghiên cứu.
Đã tham gia từ năm 2014.
Sau khi nhận bằng Cử nhân Nghiên cứu Tôn giáo và Triết học tại Đại học Reed (1990-1994), ông hoàn thành nghiên cứu tiến sĩ tại Đại học New York với Yann LeCun (2003-2008) ), tập trung vào học máy bằng cách sử dụng mạng thần kinh Xiêm (ngày nay thường được gọi là “mất ba giai đoạn”), thuật toán nhận dạng khuôn mặt và nghiên cứu robot di động sử dụng học sâu trong tự nhiên. Bài báo “Học tầm nhìn xa cho robot offroad” đã đoạt giải Bài báo xuất sắc năm 2009.
Làm nghiên cứu sinh sau tiến sĩ tại Viện Robotics tại Đại học Carnegie Mellon, làm việc với Drew Bagnell và Martial Hebert, sau đó là Nhà khoa học Nghiên cứu Tầm nhìn & Nhóm Robotics (2009-2014).
Sau khi tham gia DeepMind, nghiên cứu tập trung vào một số thách thức cơ bản trong lĩnh vực trí tuệ nhân tạo tổng quát, bao gồm học liên tục và học chuyển giao, chiều sâu cho robot và các vấn đề điều khiển Học tăng cường và các mô hình điều hướng thần kinh. Ông là người sáng lập và tổng biên tập của tạp chí mở mới TMLR, thành viên ủy ban điều hành của CoRL, thành viên của Phòng thí nghiệm Hệ thống Học tập Châu Âu (ELLIS), và là một trong những nhà tổ chức sáng lập của NAISys (Hệ thống Khoa học Thần kinh và Trí tuệ Nhân tạo). ). Từng là cố vấn CIFAR và từng là thành viên của ủy ban điều hành WiML (Phụ nữ trong học máy).
Đã xuất bản khoảng 107 bài viết, chỉ số h-index của Google Scholar là 45 và được trích dẫn 36.265 lần.
Nikhil J Joshi
Thông tin còn hạn chế. Ông có bằng thạc sĩ vật lý tại Viện Công nghệ Ấn Độ ở Ấn Độ. về vật lý phân tử từ Viện nghiên cứu cơ bản Tata, Ấn Độ. Gia nhập Google Brain vào năm 2017 để phát triển phần mềm và trước đây đã làm việc ở nhiều công ty. Google Scholar h-index 45, được trích dẫn 8320 lần.
NVIDIA
Stan Birchfield
Nhà khoa học nghiên cứu chính và Giám đốc nghiên cứu cấp cao tại NVIDIA.
Tham gia vào năm 2016, chịu trách nhiệm chính về sự giao thoa giữa thị giác máy tính và robot, bao gồm học tập, nhận thức cũng như thực tế và tương tác qua trung gian trí tuệ nhân tạo.
Nhận bằng Tiến sĩ về kỹ thuật điện tại Đại học Stanford năm 1999, với chuyên ngành khoa học máy tính.
Sau khi tốt nghiệp, anh gia nhập công ty khởi nghiệp Quindi Corporation ở Bay Area với tư cách là kỹ sư nghiên cứu để phát triển các thuật toán âm thanh và video kỹ thuật số thông minh.
Từ năm 2013 đến 2016, ông gia nhập Microsoft và chịu trách nhiệm phát triển các ứng dụng thị giác máy tính và robot cũng như hệ thống định vị thực tế trên mặt đất, đồng thời lãnh đạo việc phát triển các chức năng chuyển đổi camera tự động .
Chỉ số h của Google Scholar là 56 và đã được trích dẫn 14.315 lần.
『7』
Một số ông trùm Trung Quốc trong ngành
Tổng cộng có 31 trong số 114 nhà nghiên cứu của công ty này là người gốc Trung Quốc, tập trung vào 12 nhà nghiên cứu xuất sắc, trong đó có 4 nhà nghiên cứu từ Google, 6 nhà nghiên cứu từ Nvidia và 1 nhà nghiên cứu từ Google. OpenAI và 1x .
Google
Fei Xia ) mạnh>
Nhà khoa học nghiên cứu cấp cao, Google DeepMind.
Tốt nghiệp Đại học Thanh Hoa năm 2016 và nhận bằng Tiến sĩ tại Khoa Kỹ thuật Điện tại Đại học Stanford vào năm 2021.
Trong quá trình học Tiến sĩ, tôi đã thực tập nghiên cứu với Dieter Fox của NVIDIA, Alexander Toshev và Brian Ichter của Google. Sau khi hoàn thành bằng tiến sĩ tại Đại học Stanford, anh gia nhập nhóm chế tạo robot của Google vào mùa thu năm 2021.
Các mối quan tâm nghiên cứu bao gồm mô phỏng robot có quy mô lớn và có thể chuyển giao, thuật toán học tập cho các nhiệm vụ dài hạn và sự kết hợp của các biểu diễn hình học và ngữ nghĩa của môi trường. Hướng nghiên cứu gần đây là sử dụng các mô hình nền tảng (Foundation Models) trong quá trình ra quyết định của các tác nhân thông minh.
Thành tích học thuật bao gồm chấp nhận 5 bài báo tại hội nghị ICRA 2023 và 4 bài báo tại hội nghị CoRL 2022.
Công việc tiêu biểu bao gồm GibsonEnv, iGibson, SayCan, v.v. iGibson phát triển môi trường tương tác quy mô lớn để robot học tập và sử dụng mô hình và học tập bắt chước trong chiến lược điều khiển robot. Kết hợp kiểm soát dự đoán (MPC). Chỉ số h của Google Scholar là 33 và số lượng trích dẫn là 12.478.
Andy Zeng
Nhà khoa học nghiên cứu cấp cao của Google DeepMind.
Có bằng cử nhân kép về khoa học máy tính và toán học tại UC Berkeley và bằng tiến sĩ về khoa học máy tính tại Đại học Princeton. Sau khi tốt nghiệp với bằng Tiến sĩ vào năm 2019, anh gia nhập Google Brain, tập trung vào học máy, thị giác, ngôn ngữ và học robot.
Các mối quan tâm nghiên cứu bao gồm robot học tập, cho phép máy móc tương tác thông minh với thế giới và tự cải thiện theo thời gian.
Thành tựu học thuật bao gồm các bài báo được công bố trong nhiều hội nghị khác nhau, chẳng hạn như ICRA, CVPR, CoRL, v.v.
Các dự án quan trọng mà anh đã tham gia bao gồm PaLM-E.
Chỉ số h của Google Scholar là 32 và số lượng trích dẫn là 12.207.
Tianhe Yu
Nhà khoa học nghiên cứu Google DeepMind.
Nhận bằng cử nhân danh dự cao nhất về khoa học máy tính, toán ứng dụng và thống kê từ UC Berkeley vào năm 2017 và bằng Tiến sĩ về khoa học máy tính tại Đại học Stanford vào năm 2022. Người cố vấn là Chelsea Finn.
Sau khi tốt nghiệp với bằng Tiến sĩ vào năm 2022, anh sẽ gia nhập Google Brain và tập trung vào học máy, thị giác, ngôn ngữ và học robot.
Các mối quan tâm nghiên cứu bao gồm học máy, nhận thức, kiểm soát, đặc biệt là học tăng cường ngoại tuyến (tức là học từ các tập dữ liệu tĩnh), đa tác vụ và siêu học. Việc sử dụng các mô hình cơ bản trong các vấn đề ra quyết định gần đây đã được khám phá.
Thành tựu học thuật bao gồm các bài báo được công bố trong nhiều hội nghị khác nhau, chẳng hạn như ICRA, CVPR, CoRL, v.v.
Các dự án quan trọng mà anh đã tham gia bao gồm PaLM-E.
Chỉ số h của Google Scholar là 25 và số lượng trích dẫn là 7726.
Chu Ngọc Tương
Kỹ sư nghiên cứu cấp cao của Google DeepMind.
Học thạc sĩ và tiến sĩ về khoa học máy tính tại Imperial College London, Vương quốc Anh, từ năm 2010 đến 2018, dưới sự hướng dẫn của Giáo sư Stefanos Zafeiriou.
Từ tháng 9 năm 2017 đến tháng 3 năm 2018, tôi đã thực hiện một đợt thực tập nghiên cứu về học tăng cường sâu và robot tại Google Brain & DeepMind, đồng thời tham gia Google DeepMind vào tháng 12 năm 2018 với tư cách là một kỹ sư nghiên cứu.
Các chủ đề nghiên cứu bao gồm giải thuật robot, học bắt chước người thứ ba, nghiên cứu hình dạng dày đặc trên mô hình biến dạng thống kê, v.v.
Chỉ số h của Google Scholar là 17 và số lượng trích dẫn là 3099.
NVIDIA
Linxi Fan (Fan Linxi )
Nhà khoa học nghiên cứu cấp cao của NVIDIA và người đứng đầu Phòng thí nghiệm GEAR.
Nhận bằng Tiến sĩ từ Phòng thí nghiệm Thị giác của Đại học Stanford, nghiên cứu dưới sự hướng dẫn của Giáo sư Li Feifei.
Đã làm việc tại OpenAI (với Ilya Sutskever và Andrej Karpathy), Baidu AI Lab (với Andrew Ng và Dario Amodei) và thực hành MILA (với Yoshua Bengio).
Nghiên cứu khám phá ranh giới của các mô hình cơ sở đa phương thức, học tập tăng cường, thị giác máy tính và các hệ thống quy mô lớn.
Tiên phong tạo ra Voyager (tác nhân AI đầu tiên chơi Minecraft thành thạo và liên tục hướng dẫn các chức năng của nó), MineDojo (mở bằng cách xem 100.000 video Minecraft trên YouTube) học tập tác nhân ), Eureka (bàn tay robot 5 ngón thực hiện các nhiệm vụ cực kỳ khéo léo như xoay bút) và VIMA (một trong những mô hình hoạt động cơ bản đa phương thức sớm nhất của robot). MineDojo đã giành được Giải thưởng Bài báo Xuất sắc tại NeurIPS 2022.
Chỉ số h của Google Scholar là 18 và số lượng trích dẫn là 5619.
Chen-Hsuan Lin
Nhà khoa học nghiên cứu cấp cao của NVIDIA.
Tốt nghiệp Đại học Quốc gia Đài Loan với bằng cử nhân kỹ thuật điện. về Robotics tại Đại học Carnegie Mellon, do Simon Lucey giám sát và được hỗ trợ bởi Học bổng sau đại học của NVIDIA.
Thực tập tại Facebook AI Research và Adobe Research.
Làm việc về thị giác máy tính, đồ họa máy tính và các ứng dụng AI tổng hợp. Quan tâm đến việc giải quyết các vấn đề liên quan đến việc tạo nội dung 3D, bao gồm tái tạo 3D, kết xuất thần kinh, mô hình tổng quát, v.v.
Nghiên cứu đã giành được Giải thưởng Phát minh Tốt nhất năm 2023 của tạp chí TIME.
Chỉ số h của Google Scholar là 15 và số lượng trích dẫn là 2752.
De-An Huang (黄德安)
Nhà khoa học nghiên cứu của NVIDIA, chuyên về thị giác máy tính, robot, học máy, Tin sinh học.
Có bằng Tiến sĩ về khoa học máy tính tại Đại học Stanford, dưới sự giám sát của Fei-Fei Li và Juan Carlos Nibles. Trong thời gian lấy bằng thạc sĩ tại Đại học Carnegie Mellon, anh đã cộng tác với Kris Kitani và trong thời gian học đại học tại Đại học Quốc gia Đài Loan, anh đã cộng tác với Yu-Chiang Frank Wang.
Từng làm việc với tư cách là Dieter Fox của Phòng thí nghiệm Robotics của NVIDIA Seattle, Vignesh Ramanathan và Dhruv Mahajan của Học máy ứng dụng của Facebook, Zichen Liu của Viện nghiên cứu Microsoft Redmond và Thực tập sinh cho Leonid Sigal tại Viện nghiên cứu Disney ở Pittsburgh.
Chỉ số h của Google Scholar là 32 và số lượng trích dẫn là 4848.
Kaichun Mo
NVIDIA Một nhà khoa học nghiên cứu tại Phòng thí nghiệm Robotics Seattle do Giáo sư Dieter Fox đứng đầu.
Nhận bằng Tiến sĩ về khoa học máy tính tại Đại học Stanford, dưới sự hướng dẫn của Giáo sư Leonidas J. Guibas. Trước đây ông từng liên kết với Nhóm Máy tính Hình học và Phòng thí nghiệm Trí tuệ Nhân tạo tại Đại học Stanford. Trước khi gia nhập Stanford vào năm 2016, anh đã có bằng cử nhân ngành khoa học máy tính ACM của Đại học Giao thông Thượng Hải (PS: Tỷ lệ trúng tuyển trực tiếp của lớp danh dự ACM Thượng Hải cao tới 92% và anh đã giành chức vô địch toàn cầu của cuộc thi danh dự ACM Thượng Hải. Cuộc thi lập trình dành cho sinh viên trường Cao đẳng Quốc tế ACM 3 lần và đào tạo 640 sinh viên khoa học máy tính “có bộ não mạnh nhất”). Điểm trung bình là 3,96/4,30 (xếp hạng 1/33).
Các lĩnh vực chuyên môn là thị giác máy tính 3D, đồ họa, robot và học sâu 3D, đặc biệt tập trung vào học sâu 3D lấy đối tượng làm trung tâm và cấu trúc dữ liệu Hình ảnh 3D. học cách biểu diễn.
Chỉ số h của Google Scholar là 20 và số lượng trích dẫn là 17654.
Xinshuo Weng
Nhà khoa học nghiên cứu của NVIDIA, làm việc với Marco Pavone.
Cô đã nhận bằng Tiến sĩ về Robotics (2018-2022) và Thạc sĩ về Thị giác Máy tính (2016-17) từ Đại học Carnegie Mellon với Năm Kris Kitani). Tốt nghiệp Đại học Vũ Hán với bằng cử nhân.
Cô cũng đã làm việc với Yaser Sheikh của Facebook Reality Lab với tư cách là kỹ sư nghiên cứu, giúp xây dựng "khả năng ngoại cảm giống như thật".
Các mối quan tâm nghiên cứu bao gồm các mô hình tổng quát của hệ thống tự trị và thị giác máy tính 3D. Bao gồm các nhiệm vụ như phát hiện mục tiêu, theo dõi nhiều mục tiêu, nhận dạng lại, dự đoán quỹ đạo và lập kế hoạch chuyển động. Đã phát triển các hệ thống theo dõi đa đối tượng 3D như AB3DMOT có >1.300 sao trên GitHub.
Chỉ số h của Google Scholar là 23 và số lượng trích dẫn là 3472.
Zhiding Yu (Yuzhiding)
Trưởng nhóm nghiên cứu khoa học và lãnh đạo Nhóm nghiên cứu học máy của NVIDIA.
Nhận bằng Tiến sĩ về kỹ thuật điện và máy tính của Đại học Carnegie Mellon năm 2017 và bằng thạc sĩ về kỹ thuật điện và máy tính của Đại học Khoa học và Công nghệ Hồng Kông vào năm 2012 Cử nhân Khoa học. Tốt nghiệp Khoa Kỹ thuật Điện Liên hợp (Lớp thực nghiệm Feng Bingquan) của Đại học Công nghệ Nam Trung Quốc năm 2008.
Các mối quan tâm nghiên cứu chủ yếu tập trung vào học biểu diễn sâu, học giám sát/bán giám sát yếu, học chuyển giao và dự đoán có cấu trúc sâu, cũng như các ứng dụng của chúng trong ứng dụng các vấn đề về thị giác và robot .
Người chiến thắng trong phần Phân đoạn ngữ nghĩa thích ứng miền trong WAD Challenge@CVPR18. Giành giải bài viết hay nhất tại WACV15.
Chỉ số h của Google Scholar là 42 và số lượng trích dẫn là 17064.
OpenAI
Mengyuan Yan
Nhân viên kỹ thuật.
Nhận bằng cử nhân vật lý tại Đại học Bắc Kinh năm 2014 và bằng tiến sĩ về kỹ thuật điện và điện tử tại Đại học Stanford năm 2020.
Thành viên của Phòng thí nghiệm nhận thức tương tác và học tập robot (IPRL), một phần của Phòng thí nghiệm AI Stanford, do Jeannette Bohg và Leonidas Guibas cố vấn.
Các lĩnh vực nghiên cứu bao gồm thị giác máy tính, học máy, robot và mô hình tổng quát.
Tổng cộng có 28 bài viết đã được xuất bản, với chỉ số h của học giả Google là 15 và số trích dẫn là 4.664 lần.
1X Công nghệ
Eric Jang< /strong>
Phó chủ tịch AI.
Tốt nghiệp Đại học Brown với bằng thạc sĩ năm 2016, chuyên ngành khoa học máy tính.
Làm việc tại Google từ năm 2016 đến năm 2022 với tư cách là nhà khoa học nghiên cứu cao cấp về robot,
Nghiên cứu chuyên ngành Tập trung vào việc áp dụng các nguyên tắc học máy vào lĩnh vực robot, đã phát triển Tensor2Robot, khung ML được nhóm vận hành robot và Robot hàng ngày sử dụng (cho đến khi TensorFlow 1 không còn được dùng nữa); là đồng lãnh đạo của nhóm Brain Moonshot sản xuất SayCan.
Rời Google Robotics vào tháng 4 năm 2022 và gia nhập 1X Technologies (trước đây gọi là Halodi Robotics), dẫn dắt nhóm hoàn thành hai nhiệm vụ quan trọng Một là từ đầu đến cuối. -end Neural Mạng thực hiện quyền tự chủ của robot hình người EVE.
Là tác giả đầu tiên của 7 bài báo, với hơn 15 đồng tác giả, h-index của học giả Google là 23 và trích dẫn là 11.213. Đã viết cuốn sách "AI tốt cho bạn" về lịch sử và tương lai của trí tuệ nhân tạo.
『8』
Khóa Google và Google thông qua các tài liệu nghiên cứu chính và thử nghiệm dự án tài năng tình báo thể hiện của NVIDIA.
Google tập trung vào nghiên cứu mô hình cơ bản và các công bố nghiên cứu chính liên quan đến các tài năng trí tuệ được thể hiện bao gồm:
SayCan: Có khả năng chia nhỏ các nhiệm vụ cấp cao thành các nhiệm vụ phụ có thể thực thi được.
Gato: Mã hóa dữ liệu đa phương thức và nhập dữ liệu đó vào kiến trúc Transformer.
RT-1: Nhập dữ liệu quỹ đạo của rô-bốt vào kiến trúc Máy biến áp để nhận mã thông báo hành động rời rạc.
PaLM-E: Dựa trên mô hình chung PaLM, hiệu suất đa phương thức được cải thiện hơn nữa.
RoboCat: Việc kết hợp mô hình đa phương thức Gato với bộ dữ liệu robot cho phép RoboCat xử lý ngôn ngữ, hình ảnh và hành động trong môi trường mô phỏng và vật lý.
RT-2: Là sự kết hợp giữa mô hình RT-1 và mô hình PaLM-E, cho phép mô hình robot phát triển từ VLM sang VLA.
RT-X: Trong khi vẫn duy trì kiến trúc ban đầu, nó cải thiện toàn diện năm khả năng của trí thông minh hiện thân.
Các mô hình trên đã dần hiện thực hóa sự kết hợp giữa khả năng ra quyết định độc lập và đáng tin cậy của mô hình, nhận thức đa phương thức và khả năng vận hành và kiểm soát chính xác theo thời gian thực, đồng thời thể hiện năng lực khái quát hóa và năng lực chuỗi tư duy.
Dựa trên các tài liệu nghiên cứu trên, tổng cộng 143 nhà nghiên cứu của Google đã được chọn ra.
NVIDIA tập trung vào đào tạo mô phỏng và các dự án thử nghiệm mà các tài năng thông minh của họ tham gia bao gồm:
Eureka: Thiết kế cơ chế khen thưởng cho việc học tăng cường bằng mô hình ngôn ngữ lớn
Voyager: Sử dụng mô hình ngôn ngữ lớn để thúc đẩy trí thông minh trong thế giới mở Body
MimicPlay: Học bắt chước từ xa bằng cách quan sát hành động của con người
VIMA : Điều khiển lệnh hiện đại đa phương thức để thực hiện các nhiệm vụ robot phổ quát
MinDojo: Sử dụng dữ liệu trên quy mô Internet để xây dựng trí thông minh thể hiện mở
Ngoài ra, NVIDIA sẽ tập trung vào trí thông minh thể hiện vào năm 2024 và chính thức công bố thành lập phòng thí nghiệm GEAR (Nghiên cứu tác nhân thể hiện tổng quát), chủ yếu tập trung vào đa phương thức mô hình cơ bản, nghiên cứu robot nói chung và thế giới ảo Nghiên cứu được thực hiện trong bốn lĩnh vực chính: tác nhân cơ bản và công nghệ mô phỏng và dữ liệu tổng hợp, nhằm thúc đẩy sự phát triển của các công nghệ AI như mô hình lớn từ thế giới ảo đến thế giới thực.
Bài viết này trước tiên sắp xếp tổng cộng 7 tài liệu dự án cốt lõi của Google được đề cập ở trên. Mỗi bài viết liệt kê chi tiết các nhà nghiên cứu dự án và công bố rõ ràng nội dung công việc cụ thể của họ.
Trang nghiên cứu của NVIDIA đã công bố danh sách những người tham gia dự án chế tạo robot, tổng cộng có 54 người, ngoài ra còn có tính đến tất cả các tác giả của các bài báo được xuất bản bởi; GEAR, tổng cộng 105 người cụ thể đã được chọn ra.
Phụ lục: Danh sách 100 người có trí thông minh hiện thân từ Google và NVIDIA
< /p>