Nguồn: AI Technology Review
Đây là ngôi sao công nghệ hot nhất đầu năm 2025. Chỉ trong vài ngày, quá khứ từ thời thơ ấu đến khi trưởng thành của Lương Văn Phong đã được trình làng với toàn thế giới, bao gồm cả ngôi nhà mới mà anh chưa kịp trang trí và căn lều anh dùng để ngủ trong nhà, trở thành biểu tượng cho cá tính độc đáo của anh.
Mặc dù tính cách độc đáo được nói đến rất nhiều, nhưng đó không phải là chìa khóa thành công. Những thứ duy nhất mà sinh viên đại học vô danh này có thể dựa vào trong thập kỷ qua là suy nghĩ và khả năng của mình.
Mọi người đều tò mò về câu hỏi này: tại sao Liang Wenfeng lại tạo ra DeepSeek? Điều này chắc chắn là do thời đại, cũng như kinh nghiệm cá nhân của ông vốn rất khác biệt so với các nhà nghiên cứu mô hình quy mô lớn khác. Nhưng AI Technology Review tin rằng việc hiểu được Liang Wenfeng là người như thế nào chính là chìa khóa để hiểu được vấn đề này.
1 Tìm kiếm nhân tài không cần nhãn mác
Các công ty săn đầu người cảm thấy rằng việc giúp công ty của Liang Wenfeng tìm được người là quá khó khăn.
Một chuyên gia săn đầu người đã làm việc chặt chẽ với Huanfang trong 21 năm cho biết, việc tuyển dụng khiến anh "muốn khóc" vì quá khó khăn.
“Với bằng cử nhân của Thanh Hoa và sáu bài báo được công bố tại các hội nghị hàng đầu, bạn sẽ nghĩ rằng sẽ không có vấn đề gì, phải không? Nhưng tại sao hồ sơ của anh ấy lại bị từ chối? Một tiến sĩ của MIT với bằng cử nhân của Thanh Hoa đã bị loại ở vòng phỏng vấn thứ hai.”
Nếu tìm được ứng viên trong các công ty lớn, anh ấy tin rằng Huanfang và DeepSeek về cơ bản sẽ không so sánh với các công ty trong nước, họ sẽ chỉ so sánh với các công ty khổng lồ ở nước ngoài như Google và Meta.
Một headhunter khác không khỏi cảm thấy choáng ngợp khi nói về DeepSeek. “Họ quá kén chọn. Họ giới thiệu một quản lý cấp trung trẻ tuổi có thành tích rất tốt tại ByteDance, nhưng anh ấy đã bị từ chối sau một cuộc trò chuyện. Tôi rất ngạc nhiên và đã hỏi họ. Câu trả lời mà họ đưa ra cho tôi là người này không có đam mê với AI. Họ đã làm việc trên một số dự án liên quan đến AI Agent và nói chung sẽ không đưa ra những bình luận như vậy.”
Liang Wenfeng không dán nhãn tài năng. Bất kể trình độ học vấn hay thành tích trong quá khứ, anh ấy chỉ nhìn vào năng lực và phẩm chất cá nhân của một người.
Ngưỡng tài năng cực cao đã tạo nên DeepSeek như ngày nay. Trong số các đội ngũ người mẫu lớn tại Trung Quốc, đội ngũ nhân tài của DeepSeek có thể không đủ sức so sánh với các công ty hàng đầu, nhưng mật độ nhân tài của công ty này chắc chắn có thể được coi là ở hạng nhất.
Ngoài mức lương cao của DeepSeek, việc giữ chân những nhân tài này còn dựa vào mô hình quản lý tôn trọng hoàn toàn sự sáng tạo và ý tưởng. “Không có nhóm cố định, không có mối quan hệ báo cáo, không có kế hoạch hàng năm” liên quan nhiều đến lòng tin hơn là quản lý. Cuốn sách "Netflix Culture Handbook" từng nói: "Những đồng nghiệp tuyệt vời và những thử thách khó khăn là những yếu tố lớn nhất thu hút mọi người đến làm việc tại công ty". Đối với những người làm việc trong lĩnh vực AI, không có thách thức nào lớn hơn AGI.
Để làm được điều khó nhất, bạn cần tìm những người giỏi nhất và cung cấp cho họ đủ nguồn lực và sự tin tưởng. Những tài năng hàng đầu được tin tưởng thường mang lại sức mạnh bùng nổ to lớn. Lý thuyết này có thể được kiểm chứng trong sự trỗi dậy của TikTok.
Trong Tết Nguyên đán 2018, Douyin đã có thêm hơn 10 triệu người dùng mới mỗi ngày. Một giám đốc sản phẩm phụ trách tăng trưởng đã từng đề cập rằng dự án tăng trưởng này không hề có áp lực về hiệu suất và sau khi gửi email cho phòng tài chính, ông ấy đã có hơn 100 triệu nhân dân tệ ngân sách bổ sung cho chiến dịch trong tài khoản của mình. Lúc đó anh nhận ra rằng, "Với một đội như thế này, không có gì chúng ta không thể chiến thắng".
DeepSeek cũng vậy. Đối với những người có sơ yếu lý lịch bị loại, chắc chắn không phải vì trình độ học vấn của họ; đối với những người không vượt qua được cuộc phỏng vấn, chắc chắn không phải vì năng lực của họ. Nhu cầu về nhân tài có thể được tóm tắt trong một câu: Liệu người này có đáng tin cậy để làm việc cùng AGI không?
Đây là quan điểm của DeepSeek về tài năng. Hiểu được quan điểm này về tài năng là bước đầu tiên để hiểu được Liang Wenfeng.
2 Giá trị tối giản
Mặc dù đã làm việc trong lĩnh vực đầu tư định lượng nhiều năm, Liang Wenfeng không coi mình là người làm tài chính. Ông tự cho mình là, "Tôi đang làm việc trong lĩnh vực AI, nhưng tôi chỉ làm việc trong các kịch bản định lượng."
Hầu như tất cả những người từng giao tiếp với Lương Văn Phong đều nói rằng ông là người không bị thế giới bên ngoài làm phiền, "cách suy nghĩ của ông vô cùng trong sáng, đặc biệt coi trọng nguyên tắc cơ bản", "ông nói rất chậm", "ông nói vào vấn đề ngay khi mở miệng".
Đặc điểm của đầu tư định lượng phù hợp với phong cách tối giản của ông - không cần phải giải quyết các chuỗi công nghiệp phức tạp ở thượng nguồn và hạ nguồn mà chỉ cần tập trung vào dữ liệu thị trường thuần túy.
Cho đến ngày nay, Lương Văn Phong vẫn thường đắm chìm trong thế giới kỹ thuật của riêng mình, tập trung vào việc giải quyết vấn đề. Ví dụ, khi nói đến việc làm một mô hình lớn, ông sẽ nói với những người khác rằng "Bạn có thể làm được miễn là bạn có một tấm thẻ miễn là bạn có ý tưởng", và những khó khăn khác không nằm trong phạm vi xem xét.
Tiền bạc cũng vậy. Tiền là để đầu tư hoặc dùng cho mục đích từ thiện. Miễn là chi tiêu đúng chỗ thì không đáng để mất.
Cuối năm 2023, có một dự án mô hình ngôn ngữ ký hiệu lớn nhằm hỗ trợ người câm điếc và Liang Wenfeng đã được tiếp cận để thu hút đầu tư. Liang Wenfeng chỉ ra rằng ưu điểm của dự án này là tính chất phúc lợi công cộng nổi bật, trong khi nhược điểm là quy mô thị trường hạn chế. Nguy cơ tiềm ẩn là đây là dự án của một nhóm sinh viên đại học từ một trường đại học hàng đầu và họ có thể không kiên trì trong một thời gian dài.
Mặc dù có khả năng cao là ông sẽ không nhận được gì, ông vẫn đề nghị đầu tư miễn là nhóm sẵn sàng tiếp tục dự án.
Trước đây, Liang Wenfeng thường dành ra 500 triệu nhân dân tệ mỗi năm để đầu tư hoặc làm từ thiện, và giờ anh ấy chi số tiền đó cho DeepSeek. Mục đích của giao dịch chứng khoán là kiếm tiền, còn đầu tư vào các mô hình lớn là để đạt được AGI, thế thôi.
DeepSeek có gần 20.000 thẻ và cực kỳ hào phóng với sức mạnh tính toán. Ông đã hứa với nhóm mô hình ngôn ngữ ký hiệu lớn nêu trên rằng cụm sức mạnh tính toán sẽ mở cho họ bất cứ lúc nào. Nhưng anh lại hơi "keo kiệt" và có yêu cầu rất cao về tỷ lệ sử dụng của gần 20.000 thẻ này, cố gắng lấp đầy chúng và không để chúng nằm im một chỗ.
Hai hành vi này có vẻ trái ngược nhau, nhưng nếu giải thích theo góc nhìn của chủ nghĩa tối giản thì điều này có lý: thẻ tồn tại để sử dụng, hãy sử dụng chúng nhiều nhất có thể và đừng bao giờ lãng phí chúng.
3 Không giới hạn ở thương mại hóa
Không tốn một xu cho quảng cáo, Ứng dụng DeepSeek đã đạt được 100 triệu người dùng chỉ trong 7 ngày. Liang Wenfeng nghĩ gì về sự tăng trưởng kỳ diệu này?
Một nhà đầu tư đã hỏi Liang Wenfeng câu hỏi này vào dịp Tết Nguyên đán, nhưng Liang Wenfeng dường như không quan tâm đến lượng truy cập lớn như vậy. Câu trả lời mà nhà đầu tư nhận được là, "Điều này vẫn còn rất xa so với AGI."
Đây không phải là lời nói khoa trương của Lương Văn Phong. Theo AI Technology Review, DeepSeek chỉ phân công hai hoặc ba người chịu trách nhiệm bảo trì ứng dụng, phát triển trang web đối thoại và quản lý phần phụ trợ nạp tiền. Vì vậy, việc nó không hoạt động tốt cũng là điều bình thường.
Những thành tựu của DeepSeek trên thị trường B-end đã lan rộng hơn. Ví dụ, đợt triển khai riêng trước đây của họ chỉ có giá 450.000 nhân dân tệ, không chỉ bao gồm quyền sử dụng H20 hoặc 910b mà còn đi kèm dịch vụ mô hình lớn có thời hạn một năm. Với cùng mức giá, bạn chỉ có thể thuê 910b trong một năm trên Huawei Cloud, điều đó có nghĩa là mô hình lớn của DeepSeek gần như miễn phí.
Việc triển khai riêng tư không tạo ra tiền và DeepSeek không quan tâm liệu nó có kiếm được tiền từ API hay không. Một nhân viên của một công ty lớn từng làm việc với DeepSeek phàn nàn rằng nó có chất lượng "dùng hay không dùng", luôn khó sử dụng và không bao giờ được điều chỉnh.
Bất kể lượng khách hàng hay lượng cuộc gọi có lớn đến đâu thì cũng không đáng để quan tâm đặc biệt. Tất cả các công ty lớn đều yêu cầu xếp hàng dài vào giờ cao điểm và trải nghiệm của người dùng rất kém. Ngoài ra còn có rất nhiều phản hồi từ các khách hàng lớn, yêu cầu DeepSeek liên tục mở rộng năng lực hoặc ít nhất là phản hồi mượt mà hơn và không bị lỗi một trong hai yêu cầu, điều này gần như không thể chịu đựng được.
Thế giới bên ngoài ồn ào, nhưng Lương Văn Phong dường như không mấy quan tâm đến chuyện này.
Tình huống này nên được giải quyết như thế nào? Nhiều công ty đang gặp rắc rối vì điều này. Theo một số tin đồn nội bộ, Liang Wenfeng tin rằng các công ty lớn hoàn toàn có khả năng tự tìm ra cách giải quyết vấn đề yêu cầu không thành công và họ nên tự bảo vệ mình thay vì phụ thuộc quá nhiều vào DeepSeek để đảm bảo dịch vụ.
Câu trả lời này đủ khiến mọi người bật cười.
Có thể nói, hiện tại Lương Văn Phong không còn quan tâm đến bất kỳ khả năng thương mại hóa nào nữa.
Ngày nay, khi nhiều nhóm đang đầu tư vào ứng dụng, Liang Wenfeng đã từng nói với một người bạn tốt rằng: "Đừng cứ nhìn vào ứng dụng và triển khai trong ngành. Nếu bạn nhìn vào nó bây giờ, bạn sẽ chỉ giới hạn bản thân mình, vì vẫn chưa đến lúc và mọi thứ bạn nghĩ bây giờ đều sai. Hơn nữa, bạn đã đầu tư nhiều thời gian, năng lượng và tiền bạc hơn vào con đường sai lầm."
Đây là lời khuyên dành cho bạn bè và cũng là cách thực hành của riêng anh ấy. Đối với Liang Wenfeng, việc dồn sức vào ứng dụng và thương mại hóa là con đường sai lầm bất kể anh làm gì.
Chỉ có một con đường đúng đắn, và bây giờ anh ấy đang đi đúng hướng.