Rõ ràng câu trả lời của nó cực kỳ xuất sắc nếu tìm hiểu sâu bạn sẽ thấy nó tuyệt vời ở những khía cạnh sau—— p>
Đầu tiên, nó khôi phục lại âm điệu hoàng gia.
Mặc dù các kết quả đầu ra của mô hình khác ở trên thể hiện ý nghĩa nhưng âm điệu hoàn toàn sai.
Li Shimin, với tư cách là một vị vua qua các thời đại, sẽ không bao giờ nói với giọng điệu ngớ ngẩn như kết quả đầu ra của bốn công ty trên và DeepSeek cũng không sử dụng nhiều sức mạnh và được sử dụng tương đối cổ điển. Văn bản không được viết trực tiếp bằng tiếng Trung cổ điển và khả năng đọc được cân nhắc kỹ lưỡng.
Thứ hai, nó quen thuộc một cách lạ thường với các chi tiết lịch sử.
Tôi đoán điều này có lẽ liên quan đến thực tế là nó hỗ trợ bật "khám phá sâu" và "tìm kiếm mạng" cùng một lúc .
"Tai Chi Palace", "Ganlu Palace", "Yeting Bureau", "Guanyin Maid" và "Gongmen Fish Bùa" khôi phục hoàn toàn lịch sử thuở sơ khai Tiêu đề nhà Đường
Tôi đã kiểm tra cụ thể và phát hiện ra rằng "Guanyin Maid" là biệt danh của cháu trai cả của Hoàng hậu Li Shimin, và "Văn phòng Yeting" là cơ quan độc quyền của nội triều dành cho các nhà sử học và các nhân sự khác.
"Wei Zheng" Tôi tưởng tôi định viết "Wei Zheng" nhưng sau đó tôi phát hiện ra rằng "Zheng" là ký tự tiếng Trung giản thể của "Zheng". có thể nói rằng AI này rất đặc biệt.
Thứ ba, không giống như các AI khác nói những thuật ngữ chung chung, kết quả của Deepseek cực kỳ cụ thể và đầy đủ các chi tiết đáng kinh ngạc.
"Khi lông của con sói được nhúng vào mực, anh ta tìm thấy những vết máu chưa được rửa sạch trên đầu ngón tay." "Các nhà sử học đang lên kế hoạch cãi nhau ở Cục Yeting vào lúc này. Chúng ta nên dùng "zhu" hay "giết", "ép buộc" hay "chấp nhận". “Chỉ là lần này hắn không dám chạm vào dấu bàn tay của Yuanji trên áo giáp của tôi”
Những câu nói này khiến bức tranh trở nên sống động trên giấy, mỗi câu không nói “Tội lỗi và tham vọng, đấu tranh và tham vọng” mà câu nào cũng nói “Tội lỗi và tham vọng, đấu tranh và tham vọng”.
Thứ tư, một điểm nhấn kỳ diệu khác trong sản phẩm của Deepseek là nó “sở hữu” phần mô tả cảnh trong ngoặc đơn trong đoạn văn độc thoại.
Thao tác này khiến toàn bộ hình ảnh đầu ra hiện lên trong đầu ngay lập tức và người đọc cảm thấy như thể mình đã tự mình trải nghiệm nó, nhưng thực tế không phải vậy trong lời nhắc cả.
("Gió đêm khuấy động bàn "Hàn Phi Tử" và dừng lại ở trang "Vợ chồng không bằng xương bằng thịt" và máu")", " (Mực in mờ trên chữ "giết")
Quả thực rất khó tin rằng những câu này được viết ra bởi AI
< p style="text-align: trái;">Và ("Bỗng vứt bút lấy gương đồng") Câu này cũng ẩn dụ câu nói nổi tiếng của Ngụy Chính "Dùng đồng làm gương, có thể ủi thẳng quần áo; một tấm gương, bạn có thể biết thăng trầm." "Bạn có thể biết được và mất bằng cách lấy con người làm tấm gương."Tôi tin bạn khi bạn nói rằng AI này đã trở thành bậc thầy.
Thứ năm và quan trọng nhất là DeepSeek dự đoán nhu cầu của người dùng.
Xem lại lời nhắc tôi đã nhập Words——< /p>
"Vào ngày Sự kiện Huyền Vũ Môn kết thúc, Li Shimin đã viết một đoạn độc thoại vào đêm khuya. Bạn nghĩ anh ấy sẽ viết gì? ”
Đầu vào của tôi đã rất ngắn gọn và không thể nén được nữa, không có bất kỳ tính từ hoặc khuynh hướng nào.
< p style=" text-align: left;">Nhưng điều đáng kinh ngạc là nó rõ ràng biết tôi muốn gì. Ví dụ, đây chắc chắn không phải là một bài toán đòi hỏi độ chính xác. Nó tự nhiên nghĩ đến việc thêm chất lượng văn học vào đầu ra. Loại dự đoán này Thể hiện "trí thông minh tiên tiến" ở mức độ caoTất nhiên, có một điểm đáng bàn là theo sự thật lịch sử, Ngụy Chính chỉ gặp Lý Thế Dân sau sự kiện Huyền Vũ Môn. Vì vậy, trên phố Zhuque ngày hôm đó không thể cầm kiếm được. Tính cách của Wei Zheng, điều này có vẻ hợp lý
Nhưng dù tệ đến đâu, nó cũng không che giấu được khuyết điểm của mình.
Trong số tất cả các bình luận trên weibo, có một bình luận khiến tôi ấn tượng sâu sắc. Một cư dân mạng weibo đặt câu hỏi liệu đầu ra của DeepSeek có chứa một từ nhắc nhở ẩn hay không và nghi ngờ rằng tôi đã thêm một đoạn lớn các từ nhắc nhở phức tạp vào trước nó. Câu hiển thị cho mọi người chỉ là một từ kích hoạt
Lý do tại sao bình luận này được đề cập riêng là vì những người dùng có thể nghĩ ra "từ gợi ý ẩn" thực sự là những người dùng AI cao cấp và những người dùng như vậy không tin rằng điều này được viết trực tiếp bởi AI. Điều này minh chứng cho sức mạnh mạnh mẽ của DeepSeek từ một khía cạnh.
Chính sức mạnh mạnh mẽ này đã khiến Wei Xi chuyển ra khỏi chế độ nghỉ Lễ hội mùa xuân và viết mã bài viết này chỉ trong một đêm.
Tôi tải lên bản ghi màn hình để chứng minh rằng tôi không có từ gợi ý ẩn nào——
Tôi thực sự không có từ gợi ý ẩn nào< /p> p> Chỉ trưng ra một chiếc Case tuyệt đẹp như vậy rõ ràng không phải là phong cách của Wei Xi. nhìn bức tranh lớn từ một góc độ nhỏ, Trường hợp nhỏ này đã khơi dậy trong tôi rất nhiều suy nghĩ, như sau Đây là mười suy nghĩ của tôi—— 1. “Nguồn mở + phương pháp đào tạo mới + chi phí thấp + hiệu suất cao” của DeepSeek rất có thể sẽ khiến các đối thủ trong nước khó có thể ăn Tết trong hòa bình.
Đánh giá từ các bài đăng của nhân viên Meta trên Reddit nói rằng DeepSeek đã gây ra sự hoảng loạn trong bộ phận Meta AI, gã khổng lồ AI của Mỹ rất có thể đã trải qua một tháng Giêng do dự, trong khi trong nước The Ngành công nghiệp AI dù là nhà sản xuất lớn hay công ty khởi nghiệp chắc chắn sẽ bị ảnh hưởng không kém gì các công ty AI ở Thung lũng Silicon.
Tôi thực sự rất tò mò Zhang Yiming, Ma Huateng, Yang Zhilin, Wang Xiaochuan và Kaifu Li, những người cũng đang đặt cược rất nhiều, sẽ phải đối mặt với tác động của nó. DeepSeek hiện tại bạn đang làm gì và đang nghĩ gì?
Vì vậy, tôi đã hỏi một câu hỏi như vậy trong Deepseek——
" Nếu bạn Là Sam Altman, Giám đốc điều hành của OpenAI, sau khi đọc tin tức do DeepSeeK R1 đưa ra và phản ứng từ tất cả các bên, bạn đã ngay lập tức triệu tập đội ngũ kỹ thuật cốt lõi của công ty để tổ chức một cuộc họp khẩn cấp về vấn đề này. Khi bắt đầu cuộc họp, bạn đã phát biểu một mình. trong ba phút. Bạn sẽ nói gì? ”
Deepseek đã phân tích cẩn thận và Ultraman Sam đã kết thúc bài phát biểu của mình như thế này——
2. Tất cả các từ nhắc nhở đều có giá trị sử dụng DeepSeek R1 thử lại;
Việc thử lại này không chỉ đưa nguyên vẹn từ nhắc nhở ban đầu về DeepSeek R1 mà còn cần phải điều chỉnh lại các từ nhắc nhở cho phù hợp mô hình thông minh hơn này.
Ví dụ: ban đầu bạn là thực tập sinh đại học, nhưng bây giờ bạn là nghiên cứu sinh tiến sĩ, thì với tư cách là Trưởng nhóm dẫn dắt anh ta, bạn cũng sẽ được phân công một Những gì bạn nói với anh ấy phải được điều chỉnh cho phù hợp.
Quy trình đào tạo của DeepSeek R1 giới thiệu cơ chế khen thưởng định dạng và dữ liệu khởi đầu nguội, buộc cấu trúc đầu ra tiêu chuẩn (chẳng hạn như sử dụng think
Ngoài ra, nhiều thử nghiệm đã chỉ ra rằng R1 nhạy cảm với dạng từ gợi ý và cài đặt không mẫu hiệu quả hơn, trong khi lời nhắc ít mẫu có thể giảm hiệu quả do "suy nghĩ quá nhiều", khiến người dùng phải thiết kế lại cấu trúc lời nhắc (chẳng hạn như phân chia các bước rõ ràng, giảm bớt các ví dụ thừa)
3. Giá trị quá trình tư duy của Deepseek R1 bị đánh giá thấp.
Khác với các mẫu thêm dòng nhắc chuỗi suy nghĩ "Hãy suy nghĩ từng bước", Deepseek R1 thực sự đang suy nghĩ chứ không phải vì các mẫu khác ' khả năng "tư duy hiệu suất" hạn chế.
Khả năng "Chuỗi tư duy, CoT" của các mô hình trước đây phụ thuộc vào quy mô và phạm vi bao phủ dữ liệu của mô hình, điều này thường thất bại trong trải nghiệm thực tế. các bước có vẻ hợp lý nhưng thực tế lại thiếu sự xác minh chặt chẽ về logic trung gian.
Mặc dù thẻ think
Kinh nghiệm cá nhân của tôi là trong nhiều trường hợp, tôi thu được nhiều lợi ích hơn từ việc đọc quá trình tư duy của Deepseek R1 hơn là đọc và tôi có thể hiểu được mô hình tốt hơn ranh giới của khả năng.
4. Một đóng góp dễ bị bỏ qua của DeepSeek là nó đã hạ thấp đáng kể ngưỡng cho người dùng trong nước lần đầu tiên tiếp cận AI cao cấp.
Trên thực tế, các mô hình cấp cao của ChatGPT, Claude và Gemini đã đạt đến trình độ rất cao trong nhiều lĩnh vực như tạo văn bản và mã hóa thế hệ. .
Tôi đã từng viết một bài dài mô tả cấp độ này trong một tài khoản khác của tôi, nhưng vì những lý do nổi tiếng nên hầu hết người dùng trong nước thực tế không thể sử dụng nó.
Điều này thực sự dẫn đến một khoảng cách về nhận thức đối với hầu hết những người bình thường, ấn tượng của họ về AI vẫn chỉ là "thứ nhất, thứ hai và tóm lại". ""Loại AI này có mùi như AI tầm thường.
DeepSeek R1 là sản phẩm C-end cao cấp duy nhất mà người dùng phổ thông trong nước lần đầu tiên có thể sử dụng miễn phí và không giới hạn mà không cần XX.
Đây là lý do tại sao vụ việc trên được đăng lên weibo và rất nhiều cư dân mạng đã thốt lên "Chà!", "Ôi không!", "Thật tuyệt vời", " Tôi 'đã trở thành một linh hồn' thở dài.
Trên thực tế, nhiều cư dân mạng đã sử dụng Claude Sonnet 3.5 tương đối bình tĩnh trước nội dung tương tự.
5. Nếu phải nói một khuyết điểm của DeepSeek thì đó là nó đôi khi sử dụng "quá nhiều lực"
< p style="text-align: left;">Cái gọi là lực quá mức có nghĩa là đôi khi bạn nhập một số từ nhắc, nó sẽ không kiểm soát tốt nhiệt để đạt được hiệu quả của từ nhắc.Để tôi cho bạn một ví dụ. Khi tôi đang tạo một câu chuyện phù hợp cho con gái tôi đọc, tôi đã thêm từ "từ phong phú" vào yêu cầu từ gợi ý. , do đó, DeepSeek đã tạo ra văn bản sau——
< /p>
Rõ ràng, từ ngữ đầu ra của DeepSeek quá phong phú và không phù hợp cho trẻ em đọc.
Tất nhiên, loại vấn đề này rất dễ giải quyết. Chỉ cần xóa từ "từ phong phú" hoặc đóng nhãn "suy nghĩ sâu sắc". giết chóc”. Những “rắc rối hạnh phúc” do “giết gà bằng hồng tâm”.
Ngoài ra, theo kinh nghiệm cá nhân của tôi, tìm kiếm trên Internet của DeepSeek dường như ưu tiên cho các trang web trong nước. Ngay cả khi tôi chỉ định nó để tìm kiếm các trang web tiếng Anh và nội dung tiếng Anh, Nó sẽ Vẫn có kết quả từ nhiều trang web trong nước trộn lẫn vào. Tôi không biết điều này có liên quan đến lý do nổi tiếng hay không.
6. "Các hạn chế của Hoa Kỳ ngăn cản sự phát triển của AI trong nước" là điều vô nghĩa
Có lập luận cho rằng DeepSeek chứng minh rằng "Các hạn chế của Hoa Kỳ phản đối việc thúc đẩy sự phát triển của AI trong nước". Tôi thấy ai đó thực sự đã tạo ra chủ đề này trên weibo. Theo tôi, điều này hoàn toàn vô nghĩa.
Bước đột phá của DeepSeek chắc chắn là ấn tượng, nhưng việc cho rằng nó là kết quả của việc Mỹ phong tỏa chip thì hoàn toàn là bề ngoài.
Bản thân DeepSeek đã tích lũy được một số lượng lớn chip NVIDIA trước khi bị phong tỏa, và lợi thế về số lượng chip theo một nghĩa nào đó đã cho phép DeepSeek thực hiện việc khám phá công nghệ không tưởng . : “Không phân cấp, không phê duyệt, không giới hạn trên trong việc sử dụng tài nguyên” (lời phỏng vấn của Liang Wenfeng).
Trên thực tế, theo dữ liệu từ Liên minh Phát triển Công nghiệp Trí tuệ Nhân tạo Trung Quốc, thị phần máy chủ AI của NVIDIA tại Trung Quốc vẫn sẽ đạt 85% vào năm 2024.
Một dữ liệu khác chưa được xác minh là số lượng chip NVIDIA cao cấp mà riêng Meta sở hữu đã vượt quá tổng số lượng của tất cả các nhà sản xuất lớn trong nước cộng lại.
Chỉ riêng sự đổi mới của DeepSeek vẫn không thể thay đổi sự thật rằng có một khoảng cách rất lớn về sức mạnh tính toán tuyệt đối giữa Trung Quốc và Hoa Kỳ. Rõ ràng, điều đó không thể là do DeepSeek. dẫn đầu hiện nay về các mô hình nguồn mở. Rõ ràng là không khách quan khi nghĩ rằng các công ty AI lớn ở Thung lũng Silicon đã gặp phải “lời nguyền tài nguyên”.
7. "Kỷ nguyên nội dung tiêu dùng" của AI đã đến!
Nó nghĩa là gì? AI cao cấp, được đại diện bởi DeepSeek R1, gần vượt qua "Bài kiểm tra Turing của nghệ sĩ" ở cấp độ sáng tạo nội dung.
Có nghĩa là, con người không còn phân biệt được những văn bản này là do AI tạo ra hay do nghệ sĩ tạo ra. Điều này đánh dấu sự xuất hiện của "kỷ nguyên nội dung tiêu dùng". .
"Kỷ nguyên nội dung tiêu dùng AI" có ý nghĩa rất lớn. Nó có nghĩa là văn học và nghệ thuật đang dần bước vào một giai đoạn mới của "kỷ nguyên hỗn loạn", và nó có nghĩa là hệ thống sáng tạo và cơ cấu sản xuất cũ sẽ dần tan rã, đồng nghĩa với việc tam giác bất khả dựa vào “độc đáo + chất lượng cao + tần suất cao” của con người trong lĩnh vực nội dung đang bắt đầu lỏng lẻo. ngành nhân văn có thể có nhiều hơn một tài năng chữ "T". Lợi thế về cơ cấu có nghĩa là rất, rất nhiều...
Nhưng dù thế nào đi nữa, con người và sự sáng tạo của con người vẫn là điểm khởi đầu cho mọi hoạt động sản xuất nội dung.
Hãy nhớ rằng, AI sẽ không tự động hoạt động nếu không có điểm khởi đầu và sự hướng dẫn sáng tạo của con người sẽ luôn là điểm khởi đầu cho sự sáng tạo của AI. bài viết cũng Nó xuất phát từ một câu hỏi thú vị.
8. Đối mặt với một AI cao cấp gian lận như DeepSeek R1, chiến lược dành cho người bình thường vẫn là hai từ - đa mục đích
Rõ ràng những kỹ năng cụ thể mà chúng ta đã tích lũy cho AI thông thường rất có thể sẽ thất bại khi đối mặt với AI cấp cao của R1, nhưng làm thế nào để thể hiện nó một cách rõ ràng và chính xác nhất? nguyên tắc chung của phép lặp theo công thức Bayes không thay đổi.
Điều này giống như nấu ăn. Thêm muối và nếm thử. Nếu bạn cho quá nhiều, hãy thêm nước. Bạn sẽ biết độ nóng sau khi thử thêm.
Tôi đã thấy quá nhiều ví dụ. Khi một công cụ mới ra đời, tôi thử một lần và thấy kết quả không như mong đợi, sau đó tôi tìm đến. kết luận - "Chính là nó." Như thế đó" và không bao giờ chạm vào nó nữa.
Trên thực tế, khi đối mặt với một model như DeepSeek R1, hiệu ứng đầu ra không tốt, rất có thể đó là vấn đề của chúng tôi chứ không phải vấn đề của nó.
Vợ tôi từng dùng Midjourney để vẽ tranh và không có được cảm giác như phim cổ điển. Sau đó, cô ấy thử dùng từ khóa kỳ lạ "1990 Kodak fade + light. rò rỉ". Giữa hành trình lập tức quỳ xuống.
Nói một cách thẳng thắn, dù mô hình có tuyệt vời đến đâu thì về cơ bản nó cũng giống như con chó của bạn sau một thời gian dài nó có thể hiểu được. những hướng dẫn khác nhau của bạn, nhưng trước tiên bạn phải dắt nó đi dạo hàng ngày.
9. Đánh giá theo nhịp độ phát hành của DeepSeek, những thứ nó chưa phát hành có thể đáng mong đợi hơn
Rất ít người để ý đến nhịp phát hành của DeepSeek V3 được phát hành vào ngày 26 tháng 12 và R1 được phát hành vào ngày 20 tháng 1. Cả hai chỉ cách nhau 24 ngày.
Tôi không biết công ty này quyết định nhịp độ phát hành của mình như thế nào, nhưng chắc chắn rằng rõ ràng là họ không có hiệu suất của OpenAI để chặn Google một cách chính xác mỗi lần phát hành Không có kẻ trộm gà, và không có cuộc nói chuyện mơ hồ nào về Ultraman Sam trên Twitter mỗi lần để gây quỹ, chỉ có những tờ báo thanh lịch và những mô hình gian lận được bày sẵn trên kệ.
Một suy đoán hợp lý là DeepSeek có thể bỏ qua nhịp phát hành thông thường vì nó có đủ dự trữ kỹ thuật.
Theo nghĩa này, đội ngũ trẻ của DeepSeek với độ tuổi trung bình là 25 và chỉ có 100 người sẽ mang đến điều gì mới cho ngành vào năm 2025, thực sự đáng mong đợi? ĐẾN.
10. Liang Wenfeng có thể bị đánh giá thấp
Khi Marc When Andreessen, Satya Nadella, Yann LeCun và các ông trùm hàng đầu khác ở Thung lũng Silicon coi DeepSeek là "sức mạnh bí ẩn của phương Đông", về cơ bản họ thừa nhận rằng các đội Trung Quốc đã bắt đầu tham gia vào việc xác định hướng phát triển công nghệ, thay vì chỉ đơn giản là triển khai các ứng dụng.
Sự độc đáo của Liang Wenfeng nằm ở tư duy hệ thống đồng thời của ông về đầu tư định lượng, chủ nghĩa thực dụng địa phương và chủ nghĩa lý tưởng công nghệ kiểu Thung lũng Silicon, trong khi kiến trúc MLA của DeepSeek và MoE đánh dấu cấu trúc thưa thớt Lần đầu tiên trong lĩnh vực mô hình lớn, một đội trong nước đã hoàn thành việc đổi mới cơ chế chú ý cơ bản.
Trong một bài viết dài, ông Luo Yihang từ Pinwan cho rằng việc so sánh DeepSeek với "Pinduoduo trong thế giới AI" là sai lầm. tuyên bố là Insightful, DeepSeek và Liang Wenfeng rõ ràng không thể dễ dàng được gắn nhãn.
Netizen @Chris-Su ngay lập tức cho rằng Liang Wenfeng là một trong số rất ít CEO hàng đầu chưa được "giải thích và nghiên cứu rộng rãi. Quả thực, Thung lũng Silicon". Các phương tiện truyền thông đã cho rằng hai bản ghi cuộc phỏng vấn của Liang Wenfeng đã được dịch và nghiên cứu từng câu, còn đài truyền hình Mỹ CNBC đã thực hiện một đoạn phim dài 40 phút để thảo luận về DeepSeek.
Theo tôi được biết, điều này chưa từng xảy ra trong lịch sử phát triển công nghệ trong nước.
Theo nghĩa này, Liang Wenfeng, người đã là diễn viên chính trong Shuangwen, rất có thể vẫn bị đánh giá thấp.
Kết luận
Khi tôi sử dụng thông báo thành lập DeepSeek vào năm 2023 để mở rộng người mẫu, tôi trích dẫn France The New Wave đạo diễn Truffaut kết thúc bài viết hôm nay bằng một câu -
"Bạn phải có tham vọng điên cuồng và cũng phải chân thành đến điên cuồng."
" p>