Nguồn: Overseas Unicorns
Chúng tôi đã nói về nửa sau của AI kể từ 24Q3. Mặc dù OpenAI o1 đã đề xuất câu chuyện RL, nhưng nó đã không phá vỡ vòng tròn vì nhiều lý do. DeepSeek R1 đã giải quyết được câu đố RL và đưa toàn bộ ngành công nghiệp vào một mô hình mới, thực sự bước vào nửa sau của trí thông minh.
Đã có nhiều cuộc thảo luận trên thị trường về DeepSeek là gì và tại sao. Cuộc thảo luận có giá trị hơn tiếp theo là làm thế nào để tham gia cuộc đua AI? Tôi đã tóm tắt những suy nghĩ của mình trong nửa tháng qua, hy vọng rằng đây sẽ là lộ trình để khám phá nửa năm còn lại và tôi sẽ xem lại chúng sau một thời gian. Chúng tôi cũng đã liệt kê một số câu hỏi tò mò nhất. Bạn được chào đón để điền vào bảng câu hỏi để trao đổi ý tưởng. Chúng tôi sẽ tổ chức một cuộc thảo luận quy mô nhỏ xung quanh khoảnh khắc Aha tiếp theo của đột phá thông minh:
•Khoảnh khắc Aha tiếp theo của đột phá thông minh sẽ đến từ đâu?
• Nếu bạn có đủ nguồn lực thăm dò, bạn sẽ đầu tư chúng theo hướng nào?
• Ví dụ, kiến trúc Transformer thế hệ tiếp theo, đột phá trong dữ liệu tổng hợp và phương pháp học trực tuyến hiệu quả hơn, bạn sẽ đặt cược vào điều gì?
Insight01DeepSeek có vượt qua OpenAI không?
Không còn nghi ngờ gì nữa, DeepSeek đã vượt qua Meta Llama, nhưng vẫn còn kém xa những đối thủ hạng nhất như OpenAI, Anthropic và Google. Ví dụ, Gemini 2.0 Flash có giá thành thấp hơn DeepSeek, có khả năng mạnh mẽ và hoàn toàn là modal. Thế giới bên ngoài đã đánh giá thấp khả năng của những đối thủ hạng nhất do Gemini 2.0 đại diện, nhưng nó vẫn chưa được mã nguồn mở để đạt được hiệu ứng giật gân như vậy.
DeepSeek rất thú vị, nhưng không thể gọi là một sáng kiến cấp độ mô hình. Một mô tả chính xác hơn là nó mở nguồn cho mô hình OpenAI o1 trước đây chỉ ẩn một nửa, đưa toàn bộ hệ sinh thái lên tỷ lệ thâm nhập rất cao.
Theo quan điểm của các nguyên tắc đầu tiên, rất khó để vượt qua các nhà sản xuất mô hình hạng nhất theo kiến trúc thế hệ Transformer. Cũng khó để vượt qua trên đường cong theo cùng một con đường. Ngày nay, chúng ta mong đợi hơn vào một ai đó khám phá thế hệ tiếp theo của kiến trúc và mô hình thông minh.
![](https://img.jinse.cn/7347490_image3.png)
DeepSeek đã bắt kịp OpenAI và Anthropic chỉ trong vòng một năm.
Insight02 DeepSeek có mở ra một mô hình mới không?
Như đã đề cập trước đó, xét một cách nghiêm ngặt, DeepSeek không phát minh ra một mô hình mới.
Nhưng ý nghĩa của DeepSeek nằm ở chỗ giúp mô hình mới về RL và tính toán thời gian thử nghiệm thực sự trở nên phổ biến. Nếu bản phát hành o1 đầu tiên của OpenAI đặt ra một câu đố cho ngành công nghiệp thì DeepSeek là công ty đầu tiên công khai giải quyết được câu đố đó.
Trước khi DeepSeek phát hành R1 và R1-zero, chỉ có một số ít người trong ngành thực hành các mô hình RL và lý luận, nhưng DeepSeek đã cho mọi người thấy một lộ trình, khiến ngành công nghiệp tin rằng làm như vậy thực sự có thể cải thiện trí thông minh, điều này giúp tăng cường sự tự tin và thu hút nhiều nhà nghiên cứu AI hơn chuyển sang các mô hình nghiên cứu mới.
Chỉ khi có sự tham gia của những người tài năng thì mới có thể có sự đổi mới thuật toán và chỉ khi theo đuổi chặt chẽ nguồn mở thì mới có thể đầu tư nhiều tài nguyên điện toán hơn. Sau DeepSeek, OpenAI, vốn ban đầu không có kế hoạch phát hành các mô hình mới, đã lần lượt phát hành o3mini và có kế hoạch tiếp tục phát hành o3, đồng thời cũng đang cân nhắc các mô hình nguồn mở. Anthropic và Google cũng sẽ đẩy nhanh nghiên cứu thực tế đời thực. Sự tiến bộ của ngành công nghiệp theo mô hình mới đã được đẩy nhanh nhờ DeepSeek và các nhóm vừa và nhỏ cũng có thể thử RL trong nhiều lĩnh vực khác nhau.
Ngoài ra, việc cải thiện mô hình lý luận sẽ giúp ích hơn nữa cho việc triển khai tác nhân. Các nhà nghiên cứu AI hiện tự tin hơn vào việc nghiên cứu và khám phá các tác nhân. Do đó, cũng có thể nói rằng mô hình lý luận nguồn mở của DeepSeek đã thúc đẩy ngành công nghiệp khám phá các tác nhân sâu hơn.
Vì vậy, mặc dù DeepSeek không phát minh ra một mô hình mới, nhưng nó đã thúc đẩy toàn bộ ngành công nghiệp tiến vào một mô hình mới.
Insight 03 Sự khác biệt giữa tuyến đường kỹ thuật của Anthropic và R1 là gì?
Từ cuộc phỏng vấn của Dario, chúng ta có thể thấy rằng sự hiểu biết của Anthropic về mô hình R-1/lý luận có phần khác biệt so với mô hình O. Dario cho rằng mô hình cơ sở và mô hình lý luận nên là một phổ liên tục, thay vì một chuỗi mô hình độc lập như OpenAI. Nếu bạn chỉ thực hiện chuỗi O, bạn sẽ nhanh chóng chạm đến giới hạn.
Tôi luôn tự hỏi tại sao khả năng mã hóa, lý luận và tác nhân của Sonnet 3.5 lại đột nhiên được cải thiện rất nhiều, nhưng phiên bản 4o vẫn chưa bắt kịp?
Họ đã thực hiện rất nhiều công việc RL trong giai đoạn mô hình cơ sở tiền đào tạo. Cốt lõi là cải thiện mô hình cơ sở. Nếu không, chỉ dựa vào RL để cải thiện mô hình lý luận có thể dễ dàng làm mất hết mọi lợi ích.
Insight 04Cảm giác mà DeepSeek gây ra vừa là điều tất yếu vừa là tình cờ
"Tại sao sự vĩ đại không thể được lên kế hoạch", được viết bởi hai nhà nghiên cứu OpenAI đầu tiên, cũng là một mô tả hay về DeepSeek.
Về mặt kỹ thuật, DeepSeek có những điểm nổi bật sau:
• Nguồn mở: Nguồn mở rất quan trọng. Sau khi OpenAI trở thành một công ty nguồn đóng bắt đầu với GPT-3, ba gã khổng lồ hàng đầu không còn tiết lộ thông tin chi tiết kỹ thuật nữa, để lại một hốc sinh thái nguồn mở trống rỗng, nhưng Meta và Mistral đã không tiếp quản vị trí này. Cuộc tấn công bất ngờ của DeepSeek lần này đã giúp công ty này thuận buồm xuôi gió trên con đường nguồn mở.
Nếu cảm giác được chấm là 100 điểm, đóng góp cải thiện trí thông minh là 30 điểm, và đóng góp của nguồn mở là 70 điểm, LLaMA cũng đã được mở nguồn trước đó nhưng không có hiệu ứng giật gân như vậy, điều này cho thấy mức độ trí thông minh của LLaMa là chưa đủ.
• Rẻ: “Biên độ lợi nhuận của bạn là cơ hội của tôi” Giá trị của câu này vẫn đang tăng lên.
• Mạng lưới + CoT công cộng: Hai điểm này có thể mang lại trải nghiệm người dùng tốt cho người dùng. DeepSeek chơi cả hai lá bài cùng một lúc, có thể nói là một quả bom vua. Trải nghiệm mà nó mang lại cho người dùng C-end hoàn toàn khác biệt so với các Chatbot khác. Đặc biệt, tính minh bạch của CoT làm cho quá trình suy nghĩ mô hình trở nên công khai. Tính minh bạch có thể khiến người dùng tin tưởng AI hơn và thúc đẩy phá vỡ vòng tròn. Tuy nhiên, Perplexity đáng lẽ phải có tác động rất lớn, nhưng máy chủ DeepSeek không ổn định và nhóm Perplexity đã phản ứng nhanh chóng và khởi chạy R-1, sau đó tiếp quản một lượng lớn người dùng tràn DeepSeek R-1.
• Tổng quát hóa RL: Mặc dù RL được OpenAI o1 đề xuất lần đầu tiên, nhưng tỷ lệ thâm nhập của nó không cao do nhiều hoạt động đã được ẩn một nửa. DeepSeek R-1 đã thúc đẩy đáng kể sự tiến bộ của mô hình lý luận và cải thiện đáng kể sự chấp nhận sinh thái của nó. <. Iants bắt đầu công khai lập luận rằng Deepseek đã thách thức tình trạng của Hoa Kỳ như một bá quyền công nghệ. P>
• & NBSP; Deepseek đã khiến Nvidia, giá cổ phiếu giảm mạnh, điều này tiếp tục lên men. Thiên nga đen đầu tiên trên thị trường chứng khoán Hoa Kỳ vào đầu năm;
• Tết Nguyên đán là nơi đào tạo sản phẩm. Trong thời đại Internet di động, nhiều siêu ứng dụng bùng nổ trong Tết Nguyên đán và thời đại AI cũng không ngoại lệ. DeepSeek R1 được phát hành ngay trước Tết Nguyên đán. Điều khiến công chúng ngạc nhiên là khả năng tạo văn bản của nó, thay vì các kỹ năng lập trình và toán học được nhấn mạnh trong quá trình đào tạo. Các sáng tạo văn hóa dễ dàng hơn để công chúng cảm nhận và có nhiều khả năng lan truyền hơn.
Insight 05 Ai bị tổn thương? Ai được lợi?
Những người chơi trong đấu trường này có thể được chia thành ba loại: ToC, To Developer và To Enterprise (to Government):
1. ToC: Chatbot chắc chắn bị ảnh hưởng nhiều nhất vì tâm trí và sự chú ý đến thương hiệu của nó đã bị DeepSeek cướp mất, và ChatGPT cũng không ngoại lệ;
2. Tác động đến các nhà phát triển là rất hạn chế. Chúng tôi đã thấy người dùng bình luận rằng r1 không tốt bằng sonnet sau khi sử dụng. Các quan chức của Cursor cũng cho biết Sonnet vẫn vượt trội. Đáng ngạc nhiên là tỷ lệ người dùng cao chọn Sonnet và không có sự di chuyển trên diện rộng;
3. Chiều thứ ba là hoạt động kinh doanh của To Enterprise và To Government dựa trên sự tin tưởng và hiểu biết về nhu cầu. Lợi ích của các tổ chức lớn trong việc đưa ra quyết định rất phức tạp và sẽ không dễ di chuyển như người dùng C-end.
Từ một góc độ khác, hãy nghĩ về vấn đề này theo quan điểm của nguồn đóng, nguồn mở và sức mạnh tính toán:
Trong ngắn hạn, mọi người sẽ cảm thấy rằng OpenAI/Anthropic/Google nguồn đóng sẽ bị ảnh hưởng nhiều hơn:
• Bí ẩn của công nghệ đã được mở nguồn và phần thưởng bí ẩn quan trọng nhất trong cơn sốt AI đã bị phá vỡ;
• Các yếu tố thực tế hơn, thị trường tin rằng một số khách hàng tiềm năng và quy mô thị trường của các công ty nguồn đóng này đã bị cướp mất và thời gian hoàn vốn đầu tư GPU đã trở nên dài hơn;
• Là công ty dẫn đầu, OpenAI là công ty chịu thiệt hại nhiều nhất. Giấc mơ trước đây của công ty là giữ bí mật công nghệ và không mở nguồn, hy vọng kiếm được nhiều tiền hơn từ công nghệ, giờ đã thất bại.
Tuy nhiên, về trung hạn và dài hạn, các công ty có nguồn tài nguyên GPU dồi dào vẫn sẽ được hưởng lợi. Một mặt, Meta, một công ty hạng hai, có thể nhanh chóng theo dõi các phương pháp mới, giúp Capex hiệu quả hơn và Meta có thể là bên hưởng lợi lớn. Mặt khác, cần phải khám phá nhiều hơn để cải thiện trí thông minh. Nguồn mở của DeepSeek đã đưa mọi người lên cùng một cấp độ và việc tham gia vào các cuộc khám phá mới đòi hỏi đầu tư GPU gấp 10 lần hoặc thậm chí nhiều hơn.
Từ những nguyên lý đầu tiên, đối với ngành công nghiệp AI thông minh, dù là phát triển trí tuệ hay ứng dụng trí tuệ, đều nhất định phải tiêu tốn sức mạnh tính toán khổng lồ từ bản chất vật lý. Điều này được xác định bởi các định luật cơ bản và không thể tránh hoàn toàn bằng cách tối ưu hóa kỹ thuật.
Do đó, dù là khám phá trí thông minh hay ứng dụng trí thông minh, ngay cả khi có nghi ngờ trong ngắn hạn, nhu cầu về sức mạnh tính toán trong trung hạn và dài hạn sẽ bùng nổ. Điều này cũng giải thích tại sao Musk bắt đầu từ những nguyên tắc đầu tiên và xAI khăng khăng mở rộng cụm. Logic sâu xa đằng sau xAI và Stargate có thể giống nhau. Amazon và các nhà cung cấp dịch vụ đám mây khác đã công bố kế hoạch tăng hướng dẫn về Capex.
Giả sử rằng trình độ tài năng và nhận thức về nghiên cứu AI trên toàn thế giới là ngang nhau và nhiều GPU hơn sẽ cho phép chúng ta thực hiện nhiều khám phá thử nghiệm hơn? Cuối cùng, có thể sẽ quay trở lại cuộc cạnh tranh trong lĩnh vực máy tính.
DeepSeek không sợ đi giày ngay cả khi đi chân trần. Nó không có nhu cầu thương mại và tập trung vào việc khám phá công nghệ thông minh AGI. Hành động nguồn mở có ý nghĩa to lớn trong việc thúc đẩy sự tiến bộ của AGI, tăng cường cạnh tranh, thúc đẩy tính cởi mở và có hiệu ứng cá da trơn.
Insight 06 Liệu chưng cất có thể vượt qua SOTA không?
Có một chi tiết không chắc chắn. Nếu DeepSeek sử dụng một lượng lớn dữ liệu CoT được chắt lọc từ giai đoạn tiền đào tạo, kết quả ngày nay sẽ không đáng kinh ngạc. Nó vẫn là trí thông minh cơ bản thu được từ những gã khổng lồ hạng nhất, sau đó được mã nguồn mở. Nhưng nếu dữ liệu được chắt lọc không được sử dụng với số lượng lớn trong giai đoạn tiền đào tạo, DeepSeek đã đạt được kết quả ngày nay từ quá trình tiền đào tạo từ đầu, điều này sẽ thật đáng kinh ngạc.
Ngoài ra, khả năng chưng cất có thể vượt qua SOTA trong mô hình cơ sở là không cao. Nhưng DeepSeek R-1 rất mạnh. Tôi đoán là do mô hình Reward làm rất tốt. Nếu đường dẫn R-1 Zero đáng tin cậy, nó có cơ hội vượt qua SOTA. 、
Insight 07 Không có hào nước!
Đánh giá trước đây của Google về OpenAI: Không có hào nước! Câu này rất thích hợp ở đây.
![](https://img.jinse.cn/7347491_image3.png)
Làn sóng người dùng DeepSeek Chatbot này đã chứng kiến một số lượng lớn sự di cư, điều này đã mang đến cho thị trường một nguồn cảm hứng quan trọng: sự tiến triển của công nghệ thông minh rất mạnh mẽ và rất khó để các sản phẩm theo từng giai đoạn tạo thành một rào cản tuyệt đối.
Cho dù đó là ChatGPT/Sonnet/Perplexity vừa mới hình thành tư duy và danh tiếng, hay các công cụ dành cho nhà phát triển như Cursor và Windsurf, một khi các sản phẩm thông minh hơn có sẵn, người dùng sẽ không còn lòng trung thành với "thế hệ trước" của các sản phẩm thông minh. Ngày nay, rất khó để xây dựng một hào nước ở cả lớp mô hình và lớp ứng dụng.
DeepSeek lần này cũng đã xác minh được một điều: mô hình là ứng dụng. DeepSeek không có sự đổi mới nào về hình thức sản phẩm. Cốt lõi là trí tuệ + mã nguồn mở. Tôi không khỏi nghĩ: Trong thời đại AI, liệu có bất kỳ sự đổi mới nào về sản phẩm và mô hình kinh doanh đều kém hơn sự đổi mới của trí tuệ không?
Insight 08 Liệu DeepSeek có nên tiếp quảnlàn sóng lưu lượng truy cập Chatbot này và mở rộng nó không?
Kể từ khi Chatbot trở nên phổ biến cho đến nay, phản hồi của nhóm DeepSeek cho thấy rõ ràng DeepSeek vẫn chưa tìm ra cách sử dụng làn sóng lưu lượng truy cập này.
Bản chất của câu hỏi có nên chấp nhận và chủ động vận hành luồng giao thông này hay không là liệu một công ty thương mại lớn và một phòng nghiên cứu lớn có thể cùng tồn tại trong cùng một tổ chức hay không?
Đây là một nhiệm vụ rất khó khăn về mặt phân bổ năng lượng và tài nguyên, năng lực tổ chức và các lựa chọn chiến lược. Nếu đó là một công ty lớn như ByteDance hoặc Meta, phản ứng đầu tiên của họ sẽ là tiếp nhận và họ sẽ có một nền tảng tổ chức nhất định để làm như vậy. Tuy nhiên, với tư cách là một tổ chức phòng thí nghiệm nghiên cứu, DeepSeek sẽ phải chịu áp lực rất lớn để xử lý lượng truy cập khổng lồ này.
Nhưng đồng thời, chúng ta cũng nên suy nghĩ xem liệu làn sóng Chatbot này có phải là lưu lượng truy cập tạm thời hay không? Chatbot có phải là một phần chính của quá trình khám phá thông minh trong tương lai không? Có vẻ như mỗi giai đoạn của trí thông minh đều có một dạng sản phẩm tương ứng và Chatbot chỉ là một trong những dạng ban đầu được mở khóa.
Đối với DeepSeek, xét về góc nhìn trong 3-5 năm tới, liệu có phải là một sai lầm nếu nó không tiếp quản lưu lượng truy cập Chatbot ngay hôm nay không? Sẽ thế nào nếu một ngày nào đó xảy ra hiệu ứng quy mô? Nếu AGI cuối cùng được hiện thực hóa, thì loại sóng nào sẽ được sử dụng để truyền tải nó?
Insight09 Khoảnh khắc Aha tiếp theo của sự đột phá thông minh sẽ đến từ đâu?
Một mặt, mô hình thế hệ tiếp theo của cấp độ đầu tiên rất quan trọng, nhưng hiện nay chúng ta đang ở giới hạn của Transformer và không chắc liệu cấp độ đầu tiên có thể đưa ra được mô hình có thể đạt được sự cải thiện qua từng thế hệ hay không. OpenAI, Anthropic và Google đã phản ứng bằng cách phát hành các mô hình tốt hơn 30-50%, nhưng điều đó có thể không đủ để cứu vãn tình hình vì họ có nhiều tài nguyên hơn gấp 10-30 lần.
Mặt khác, việc triển khai Agent là rất quan trọng, vì Agent cần phải suy luận nhiều bước từ xa. Nếu mô hình tốt hơn 5-10%, hiệu ứng hàng đầu sẽ được khuếch đại lên nhiều lần. Do đó, OpenAI, Anthropic và Google phải triển khai các sản phẩm Agent trên thực tế, mô hình tích hợp đầy đủ + các sản phẩm Agent, giống như Windows + Office. Thứ hai, họ cũng phải trình bày các mô hình mạnh mẽ hơn, chẳng hạn như các mô hình thế hệ tiếp theo được đại diện bởi phiên bản đầy đủ của O3 và Sonnet 4/3.5 opus.
Trong bối cảnh công nghệ không chắc chắn, những người có giá trị nhất là các nhà nghiên cứu AI tài năng. Bất kỳ tổ chức nào muốn khám phá AGI đều phải đầu tư nguồn lực để đặt cược triệt để hơn vào mô hình tiếp theo. Đặc biệt trong bối cảnh hiện nay khi giai đoạn tiền đào tạo đã được tập hợp lại, cần phải có nhân tài giỏi + nguồn lực dồi dào để khám phá khoảnh khắc Aha tiếp theo của trí thông minh mới nổi.
Insight 10 Làn sóng DeepSeek này khiến tôi tin tưởng hơn vào tài năng AI của Trung Quốc. Thật đáng khích lệ.
Cuối cùng, tôi hy vọng công nghệ không có biên giới.