Tác giả: Paul Veradittakit Nguồn: VeradiVerdict Bản dịch: Shan Ouba, Golden Finance
DeepSeek ban đầu là một dự án phụ của quỹ đầu cơ High-Flyer và được ra mắt cùng với vài nghìn GPU Nvidia. DeepSeek R1 đã gây chấn động thế giới khi có giá hơn 1 tỷ đô la, sử dụng 2.000 GPU Nvidia H800 và mất 55 ngày để phát triển, vượt qua mô hình o1 của OpenAI vốn cần đến hàng trăm tỷ đô la và hơn 16.000 GPU tiên tiến để phát triển.
DeepSeek R1 có 671 tỷ tham số, trong khi GPT-4 có 1,76 nghìn tỷ tham số. Trong khi các mô hình lớn của OpenAI có thể yêu cầu hàng nghìn GPU để đào tạo và các cụm cao cấp để suy luận, DeepSeek 7B và 67B có thể chạy trên phần cứng dành cho người tiêu dùng (một số ít A100 hoặc H100).
![7347527 j8659LSvtUgQH2jHezM3yG3LC4Zk7yRMZABUT3co.png](https://img.jinse.cn/7347527_watermarknone.png)
DeepSeek-R1 và các đối thủ cạnh tranh
Đáp lại, giá cổ phiếu của Nvidia đã giảm 18% (mất 600 tỷ đô la giá trị thị trường). Quan niệm cũ cho rằng các mô hình AI phải là mã nguồn đóng và tốn kém về mặt tính toán để thành công đang dần sụp đổ.
Câu chuyện về AI phi tập trung hiện có
![7347542 kIDQDOBGhSRbO79H9HbJpG3ZxPf7JdbCnIMm2uzy.png](https://img.jinse.cn/7347542_watermarknone.png)
Giải mã Crypto x AI Stack
Dự án AI x Crypto tin rằng AI phi tập trung, công khai, được cộng đồng đóng góp cuối cùng sẽ tạo ra các mô hình tốt hơn AI tập trung.
Cho đến nay, điều này vẫn chưa đúng vì các mô hình có hiệu suất cao nhất đến từ các công ty nguồn đóng như OpenAI và Anthropic. Các công ty Crypto x AI đã thích nghi với tình hình này, tập trung vào cơ sở hạ tầng thay vì xây dựng mô hình.
Ví dụ, các thị trường GPU như Akash, Render, IoNet và Exabits đã đạt được doanh thu bền vững. Các công ty cho phép người dùng chia sẻ băng thông mạng, chẳng hạn như Grass và Gradient, đã tìm thấy thị trường ngách của mình bằng cách cung cấp các dịch vụ như thu thập dữ liệu web phân tán cho các máy khách web2. Các mạng lưu trữ như Arweave, Filecoin và Ocean cũng đã hoạt động tốt khi trở thành nền tảng để xây dựng các dự án này. Mạng lưới cung ứng phát triển mạnh vì họ có thể cung cấp các dịch vụ rẻ hơn và có khả năng mở rộng hơn cho khách hàng ngoài chuỗi.
![7347543 LBDHutUvJfAuggm9AIic8v0SyPSnEk5vXfdzrvxV.png](https://img.jinse.cn/7347543_watermarknone.png)
Báo cáo của Messari về DePin và AI x Crypto
Giờ đây, khi GPU và nguồn lực tài chính không còn là rào cản đối với việc tạo ra các mô hình AI chất lượng cao, các công ty AI web3 có thể tập trung vào việc sao chép hiệu quả của DeepSeek đồng thời cung cấp những lợi thế mới như phương thức, quyền sở hữu của người dùng, chống kiểm duyệt, quyền riêng tư, v.v.
Pantera đã tài trợ cho các công ty như SaharaAI và Sentient, tin rằng họ có thể sánh ngang hoặc vượt trội hơn hiệu suất của các công ty AI truyền thống trong khi vẫn duy trì khả năng cạnh tranh bằng cách cung cấp các dịch vụ khác.
Ví dụ, Sahara AI đang xây dựng một nền tảng nơi bất kỳ ai cũng có thể kiếm tiền từ các mô hình AI, tập dữ liệu và ứng dụng trong không gian cộng tác. Người dùng có thể đào tạo mô hình theo cách thủ công mà không cần quyền, cung cấp dữ liệu đào tạo và tạo các mô hình AI tùy chỉnh bằng các công cụ không cần mã. Họ chỉ có thể đáp ứng nhu cầu của tất cả các bên liên quan (nhà phát triển AI, người dùng, nhà cung cấp tài nguyên) vì mọi thứ đều gắn liền với blockchain Sahara gốc của họ.
Tương lai của AI sẽ được xây dựng trên cơ sở hạ tầng Web3
DeepSeek đã chứng minh rằng các mô hình AI hiệu suất cao không nhất thiết phải được xây dựng theo cách mã nguồn đóng hoặc phải chịu chi phí tính toán. Tôi rất háo hức muốn xem những mô hình AI nào sẽ được phát triển bằng cách sử dụng toàn bộ ngăn xếp AI web3 trong năm tới.
Tôi tin rằng các dự án hướng đến cung sẽ tiếp tục phát triển, trong khi các dự án hướng đến người tiêu dùng có thể tận dụng khả năng xây dựng mạng lưới thu hút sự tham gia của cộng đồng để bắt đầu cạnh tranh với các đối thủ web2. Ví dụ, người dùng sẵn sàng đăng ký đào tạo các mô hình web3 và đang tích cực thử nghiệm các mô hình này thông qua các cuộc thi hackathon và chương trình tài trợ.
Trong tương lai gần, tôi tin rằng các mô hình AI có hiệu suất tốt nhất sẽ được xây dựng trên chuỗi.