Người sáng lập NVIDIA Jensen Huang có bài phát biểu khai mạc tại hội nghị GTC ở San Jose, Hoa Kỳ. Trong bài phát biểu này, NVIDIA đã giới thiệu kiến trúc chip thế hệ tiếp theo Blackwell.
Theo báo cáo, GPU Blackwell được đặt theo tên của nhà toán học David Harold Blackwell và cũng tuân theo kiến trúc Hopper do Nvidia đưa ra trước đó. GPU Blackwell chứa 208 tỷ bóng bán dẫn và có thể hỗ trợ các mô hình AI với thông số lên tới 10 nghìn tỷ. Ngoài bản thân con chip, kiến trúc này còn sử dụng kết nối tốc độ cao NVLink thế hệ thứ năm và động cơ Transformer thế hệ thứ hai, được nâng cấp toàn diện về mọi mặt. Theo Huang Jenxun, con chip mới này sẽ ra mắt vào cuối năm 2024.
Huang Renxun cho biết Nvidia có kế hoạch sử dụng Blackwell để gia nhập các công ty trí tuệ nhân tạo trên toàn thế giới trong tương lai và ký hợp đồng với tất cả các OEM, đám mây khu vực, AI có chủ quyền quốc gia và các công ty viễn thông trên toàn thế giới.
Hiện tại, Amazon, Dell, Google, Meta, Microsoft, OpenAI và Tesla đều đã lên kế hoạch sử dụng GPU Blackwell. Điều đáng chú ý là B100 huyền thoại trước đó đã không xuất hiện, thay vào đó, Nvidia đã tung ra siêu chip GB200, bao gồm một CPU Grace và hai bộ GPU Blackwell. Huang Renxun cho biết so với H100, sức mạnh tính toán của GB200 gấp 6 lần so với trước đây và sức mạnh tính toán tương ứng với việc xử lý các trường cụ thể đa phương thức có thể đạt tới 30 lần.
Ngoài ra, Nvidia còn phát hành máy chủ GB200 NVL72, bao gồm 36 bộ CPU Grace và 72 bộ GPU Blackwell.
Lần này, NVIDIA sẽ ra mắt một mẫu cơ bản tổng quát lớn có tên GR00T dành cho lĩnh vực robot. Ngoài ra, NVIDIA còn cho ra mắt Thor, dòng máy tính mới phù hợp với robot, NVIDIA đã thực hiện những tối ưu hóa cụ thể về hiệu năng, mức tiêu thụ điện năng và kích thước liên quan.
NVIDIA cũng ra mắt máy chủ suy luận AI mới NIM (NVIDIA INFERENCE MICROSERVICE), cho phép mọi người tùy chỉnh các mô hình và ứng dụng AI theo dạng này. (36 krypton)