Tác giả: teafox; Nguồn: Tea Fox Sees the World
Đây là thời đại bùng nổ thông tin Đó cũng là thời đại ô nhiễm thông tin nghiêm trọng. Vì vậy, tôi sẽ không tin tưởng một cách cả tin bất kỳ thông tin nào, nhất là khi đứng trước những lợi ích lớn, tôi sẽ càng “nghi ngờ”. Đối với tôi, cách tốt nhất để loại bỏ ô nhiễm thông tin là so sánh chéo và xem xét cả ưu và nhược điểm.
Trong 48 giờ qua, tôi đã dành gần như toàn bộ thời gian của mình cho X, duyệt nhiều tin tức khác nhau về Deep Seek. Trong thế giới nói tiếng Anh, về cơ bản có rất nhiều tin tức. , lúc này tôi thực sự muốn xem những bình luận tiêu cực, và sau khi tìm kiếm xung quanh, quả thực đã có chúng.
Chủ yếu được chia thành hai loại:
Một loại, để đảo ngược, đặc biệt là một số người chống Trung Quốc ở nước ngoài sẽ đưa ra những bình luận tiêu cực đối với bất kỳ tin tức nào về Trung Quốc. Loại thông tin này chỉ đơn giản là rác rưởi. Nhưng nhìn qua cũng tốt, ít nhất bạn có thể biết rác trông như thế nào.
Loại còn lại là những bình luận tiêu cực từ những người trong ngành. Tiếng nói đầu tiên và diều hâu nhất thực sự đến từ một người trong ngành Trung Quốc-Alexandr Wang.
Trước hết, tên của người này hơi lạ. Lần đầu tiên nhìn thấy, tôi đã nghĩ đó là lỗi chính tả của CNBC. Nói chung, Alexander. là tên phổ biến nhất trong tiếng Anh. Hình thức đánh vần cũng là phiên bản được quốc tế chấp nhận. Alexandr là cách viết của một số ngôn ngữ Đông Âu (như tiếng Nga, tiếng Séc, v.v.). Hơi lạ khi một người Mỹ gốc Hoa lại có một cái tên Đông Âu. Nhưng khi tôi nhìn kỹ hơn, đó thực sự là Alexandr.
Thứ hai, ông Vương này không chỉ có cái tên lạ mà còn có xuất thân độc đáo. Anh sinh năm 1997, là người sáng lập và CEO của Scal AI. Ở tuổi 24, Alexandr Wang đã trở thành tỷ phú "tự thân" trẻ nhất thế giới. Theo Forbes, tài sản của ông trị giá 2 tỷ USD tính đến tháng 7 năm 2024.
Anh là con trai của một gia đình nhập cư Trung Quốc. Cả cha mẹ anh đều làm nhà vật lý tại Phòng thí nghiệm Quốc gia Los Alamos, nơi ra đời phòng thí nghiệm vũ khí hạt nhân. Rất hiếm khi người Trung Quốc làm việc trong loại đơn vị này.
Alexandr đam mê toán học và lập trình máy tính từ khi còn nhỏ. Anh đã đủ điều kiện tham gia Olympic Toán cùng Đội tuyển Hoa Kỳ vào năm 2013. Khi còn là thiếu niên, anh làm lập trình viên phần mềm tại Quora, phiên bản Mỹ của Zhihu. Sau đó, anh học ngành khoa học máy tính tại MIT, nhưng đã bỏ học và thành lập Scal AI, trở thành thần đồng AI ở Thung lũng Silicon.
Alexandr cho biết: Deep Seek có ít nhất 50.000 card đồ họa NVIDIA H100 nhưng không tiện nói vì lệnh trừng phạt. Sau đó, tôi đã xem cuộc phỏng vấn của CNBC nhiều lần. Những lời ban đầu của anh ấy đều là sự hiểu biết của tôi, không có bằng chứng xác thực nào.
Theo Deep Seek, mô hình đào tạo chỉ sử dụng 2048 card đồ họa H800, đây là phiên bản thiến của H100 và giá chỉ H100 (30.000 USD) một cái phần ba của . Chính vì việc sử dụng phần cứng cấp thấp mà giá trị đổi mới của Deep Seek đã được phản ánh.
Vậy tại sao Alexandr Wang lại hoảng sợ?
Tôi không phải là chuyên gia về AI, nhưng dựa trên lượng thông tin lớn tôi đã đọc trong vài ngày qua, Deep Seek có thể là một con thiên nga đen khổng lồ, và cô ấy đang ở Thung lũng Silicon.
1/ Hiện tại, chi phí đào tạo các mô hình lớn AI cấp cao nhất là cực kỳ cao. Những gã khổng lồ như OpenAI yêu cầu các trung tâm dữ liệu lớn với hàng chục nghìn card đồ họa H100. Giá tối thiểu cho mỗi khối là 30.000 USD và tổng giá là hơn một tỷ USD. Nó cũng tiêu thụ nhiều điện đến mức cần cả một nhà máy điện để cung cấp điện. Họ chi hàng trăm triệu USD chỉ để đào tạo người mẫu.
2/ Deep Seek bật lên và nói, "Haha, nếu chúng ta chi 5 triệu đô la để làm việc này thì sao?" Họ không chỉ nói Thế thôi, mà còn nó thực sự đã xảy ra. Mô hình của Deep Seek thậm chí còn đánh bại GPT-4 và Claude trong nhiều nhiệm vụ. Thế giới trí tuệ nhân tạo ở Thung lũng Silicon ngay lập tức trở nên bối rối và thiên tài AI Alexandr Wang tỏ ra không mạch lạc.
3/ DeepSeek thực hiện điều đó như thế nào? Họ suy nghĩ lại mọi thứ từ đầu. AI truyền thống giống như viết mỗi số dưới dạng 32 chữ số thập phân. Và DeepSeek cho biết: "Nếu chúng ta chỉ sử dụng 8 chữ số thập phân thì kết quả vẫn đủ chính xác!" Ngay lập tức, bộ nhớ cần thiết giảm 75%.
4/ Sau đó là hệ thống "đa thẻ" của họ. AI trung bình đọc như học sinh lớp một: "Goose... Goose... Goose... Qu... Xiang... Xiang... ...ngày...bài hát", đọc từng chữ. Nhưng DeepSeek đọc toàn bộ đoạn văn cùng một lúc. Nhanh hơn gấp 2 lần và chính xác hơn 90%, điều này rất quan trọng khi bạn xử lý hàng tỷ từ.
5/ Nhưng điều thực sự thông minh là: họ đã xây dựng một “hệ thống chuyên gia” thay vì sử dụng một trí tuệ nhân tạo lớn cố gắng hiểu mọi thứ (như yêu cầu con người trở thành bác sĩ, luật sư, kỹ sư, thợ mộc) cùng lúc, chỉ kích hoạt các chuyên gia cụ thể khi cần thiết, tiết kiệm rất nhiều thông số.
6/ Còn mô hình truyền thống thì sao? Tất cả 1,8 nghìn tỷ thông số luôn hoạt động. Đồng thời, DeepSeek có tổng cộng 671 tỷ tham số và chỉ có 37 tỷ được kích hoạt cùng một lúc. Nó giống như việc có một nhóm lớn nhưng chỉ mời những chuyên gia bạn thực sự cần cho từng nhiệm vụ.
7/ Kết quả thật đáng kinh ngạc, chi phí đào tạo: hàng trăm triệu đô la → 5 triệu đô la Mỹ; GPU yêu cầu: 100000 → 2000; Chi phí API: Rẻ hơn 95%;Có thể chạy trên card đồ họa chơi game thông thường, không phải phần cứng trung tâm dữ liệu.
8/ Phần điên rồ nhất - DeepSeek là mã nguồn mở (hoàn toàn miễn phí). Bất cứ ai cũng có thể sử dụng nó, mã được công khai. Bài báo kỹ thuật giải thích tất cả, đó không phải là phép thuật, chỉ là kỹ thuật vô cùng thông minh. Một trong những meme phổ biến nhất hiện nay là Open AI → Closed AI (AI nguồn đóng), được thay thế bằng DeepSeek, mới là Open AI (AI nguồn mở) thực sự.
9/ Tại sao DeepSeek lại quan trọng? Bởi nó phá vỡ quan niệm sai lầm rằng chỉ những công ty công nghệ lớn mới có thể tham gia vào trí tuệ nhân tạo. Bạn không còn cần một trung tâm dữ liệu tỷ đô và một vài card đồ họa chơi game tốt để làm được điều này nữa.
10/ Đối với Nvidia, điều này thật đáng sợ. Toàn bộ mô hình kinh doanh của họ dựa trên card đồ họa đắt tiền với tỷ suất lợi nhuận lên tới 90%. Ví dụ, H100, được bán với giá từ 30.000 đến 40.000 USD, là một mặt hàng hiếm mà không thể mua được ngay cả khi bạn có tiền. Nếu mọi người đột nhiên có thể thực hiện AI bằng card đồ họa chơi game thông thường... thì bạn biết vấn đề rồi.
11/ Mấu chốt là: Nhóm của DeepSeek có chưa đến 200 người, nhưng chỉ riêng lương của nhóm Meta đã vượt quá toàn bộ ngân sách đào tạo của DeepSeek… và mô hình của Meta Nhưng không tốt bằng DeepSeek.
12/ Đây là một câu chuyện kinh điển về sự gián đoạn: Những người đương nhiệm tối ưu hóa các quy trình hiện có, trong khi những người phá vỡ suy nghĩ lại các phương pháp tiếp cận cơ bản.
13/ DeepSeek giống như một trận động đất, dư chấn quá lớn: việc phát triển trí tuệ nhân tạo trở nên dễ dàng hơn, cạnh tranh gay gắt và "hào nước" của các công ty công nghệ lớn trông giống như mương, yêu cầu phần cứng (và chi phí) đã giảm đáng kể
14/ Tất nhiên, những gã khổng lồ như OpenAI sẽ không ngồi yên. Nhưng mọi thứ cần phải bị lật đổ, và sẽ không còn là hình mẫu nỗ lực để đạt được kỳ tích nữa.
DeepSeek, con thiên nga đen, sẽ vỗ cánh và toàn bộ Thung lũng Silicon sẽ bị ảnh hưởng.
Khủng hoảng khởi nghiệp AI: Hiệu suất cao của Deep Seek có thể dẫn đến sự phá sản của các công ty khởi nghiệp AI mua số lượng lớn card đồ họa NVIDIA , phát hành một số lượng lớn GPU cũ. Đối với Alexandr Wang, CEO kiêm nhà sáng lập của Scal AI, đây là vấn đề sinh tử, việc nói xấu là điều dễ hiểu.
Thất bại trong kinh doanh trung tâm dữ liệu: Các nhà khai thác trung tâm dữ liệu lớn sẽ tác động đến mô hình kinh doanh cho thuê card đồ họa Nvidia của họ.
Các gã khổng lồ công nghệ giảm tốc độ mua hàng: Các gã khổng lồ công nghệ có thể giảm lượng mua card đồ họa Nvidia do tồn đọng hàng tồn kho.
Triển vọng của Nvidia thật đáng lo ngại: Sự kết hợp của các yếu tố trên có thể dẫn đến sự suy giảm tổng thể trong hoạt động kinh doanh của Nvidia.
Trên X, một V V tài chính nói: deepseek tốt hơn không phải là thỏa thuận thực sự... ..) và sau đó thêm một bức tranh lạnh lùng.
Đỉnh cao nhất trong 75 năm: Biểu đồ cho thấy thị trường chứng khoán Mỹ đang ở mức cao nhất trong 75 năm.
Magnificent 7: Thuật ngữ này đề cập đến bảy gã khổng lồ công nghệ hoạt động tốt nhất trên thị trường chứng khoán Hoa Kỳ. Ở một mức độ nhất định, nó. thúc đẩy sự trỗi dậy của thị trường chứng khoán Mỹ.
Hai bong bóng: bong bóng Nifty 50 vào những năm 1960 và bong bóng Internet vào những năm 1990. Cả hai bong bóng đều dẫn đến sự sụp đổ của thị trường chứng khoán. Lần này, tìm kiếm sâu đã đến...liệu thị trường chứng khoán Mỹ có sụp đổ?
Cuối cùng, chúng ta cùng xem qua bài báo mà nhóm Deep Seek vừa xuất bản tại Cornell. Tác giả nào cũng đáng ghi nhớ. Hầu hết họ đều là những người trẻ dưới 30 tuổi và đến từ các trường đại học hàng đầu trong nước , một số vẫn đang học tiến sĩ và không ai trong số họ có trình độ học vấn ở nước ngoài. Điều này một lần nữa cho thấy Trung Quốc đã bắt kịp Hoa Kỳ về chất lượng giáo dục đại học và Trung Quốc sẽ có lợi thế tuyệt đối về số lượng sinh viên tốt nghiệp STEM trong vài thập kỷ tới.
Như người sáng lập DeepSeek, Liang Wenfeng đã nói: Giá trị của chúng tôi nằm ở đội ngũ và chúng tôi tiếp tục phát triển cũng như tích lũy kiến thức chuyên môn thông qua quá trình này. Xây dựng một đội ngũ có thể tiếp tục đổi mới là con hào thực sự của chúng tôi.