المؤلف: يو ليلي المصدر: موجات التيار الخفي
من بين الشركات الناشئة السبع الكبرى في الصين، تعد DeepSeek هي الأقل شهرة، ولكن من الممكن دائمًا تذكرها بطريقة غير متوقعة.
قبل عام، جاءت هذه المفاجأة من شركة الأسهم الخاصة الكمية العملاقة Huan Fang التي كانت وراءها، وكانت الشركة الوحيدة خارج الشركات المصنعة الكبرى التي حجزت 10000 شريحة A100. وبعد سنوات، سيكون مصدر حرب الأسعار بالنسبة للنماذج الكبيرة في الصين.
أصبح DeepSeek مشهورًا في شهر مايو عندما تعرض للقصف المستمر بواسطة الذكاء الاصطناعي. والسبب هو أنهم أطلقوا نموذجًا مفتوح المصدر يسمى DeepSeek V2، والذي يوفر فعالية من حيث التكلفة غير مسبوقة: يتم تقليل تكلفة الاستدلال إلى 1 يوان فقط لكل مليون رمز، وهو ما يقرب من سُبع Llama3 70B، GPT-4 One- السبعين من توربو.
انخفضت الأسعار الواحدة تلو الأخرى. إن حرب الأسعار النموذجية الكبيرة في الصين على وشك أن تندلع.
يخفي الدخان المنتشر حقيقة أنه على عكس العديد من الشركات الكبيرة التي تحرق الأموال من أجل الإعانات، فإن DeepSeek مربحة.
وراء ذلك يوجد ابتكار DeepSeek الشامل في بنية النموذج. يقترح بنية MLA جديدة تمامًا (آلية انتباه كامنة جديدة متعددة الرؤوس)، مما يقلل من استخدام الذاكرة إلى 5%-13% من بنية MHA الأكثر استخدامًا في الماضي وفي الوقت نفسه، فهي فريدة من نوعها. تعمل بنية DeepSeekMoESparse أيضًا على تقليل مقدار العمليات الحسابية إلى أقصى الحدود، وكل ذلك يساهم في النهاية في تقليل التكلفة.
في وادي السيليكون، يُطلق على DeepSeek اسم "القوة الغامضة القادمة من الشرق". يعتقد كبير المحللين في SemiAnalogy أن ورقة DeepSeek V2 "قد تكون الأفضل هذا العام". وصف أندرو كار، الموظف السابق في OpenAI، الورقة البحثية بأنها "مليئة بالحكمة المذهلة" وطبق إعدادات التدريب الخاصة بها على نموذجه الخاص. ويعتقد جاك كلارك، مدير السياسات السابق في OpenAI والمؤسس المشارك لشركة Anthropic، أن DeepSeek "توظف مجموعة من المعالجات التي لا يمكن التنبؤ بها" ويعتقد أن النماذج الكبيرة المصنوعة في الصين "ستصبح بنفس أهمية الطائرات بدون طيار والسيارات الكهربائية التي لا يمكن تجاهلها". القوة "
هذا موقف نادر في موجة الذكاء الاصطناعي حيث يقود Silicon Valley القصة بشكل أساسي. أخبرنا العديد من المطلعين على الصناعة أن هذه الاستجابة القوية تنبع من الابتكار على المستوى المعماري وهي محاولة نادرة من قبل شركات النماذج الكبيرة المحلية وحتى النماذج الكبيرة العالمية ذات القاعدة المفتوحة المصدر. قال أحد باحثي الذكاء الاصطناعي إن بنية الانتباه تم اقتراحها لسنوات عديدة، ولكن لم يتم تعديلها بنجاح تقريبًا، ناهيك عن التحقق على نطاق واسع. "حتى أن هذه فكرة سيتم قطعها عند اتخاذ القرارات، لأن معظم الناس يفتقرون إلى الثقة."
ومن ناحية أخرى، العارضات المحلية الكبيرة السبب نادرًا ما ننخرط في الابتكار على المستوى المعماري من قبل لأن قلة من الناس يأخذون زمام المبادرة لكسر الصورة النمطية: الولايات المتحدة أفضل في الابتكار التكنولوجي من 0-1، في حين أن الصين أفضل في ابتكار التطبيقات من 1-10 . والأكثر من ذلك، فإن هذا النوع من السلوك غير اقتصادي على الإطلاق - فمن الطبيعي أن يتم إنتاج جيل جديد من النماذج بواسطة شخص ما في غضون بضعة أشهر، ولا تحتاج الشركات الصينية إلا إلى متابعته وتطبيقه بشكل جيد. إن ابتكار هيكل النموذج يعني أنه لا يوجد طريق يجب اتباعه، ويجب تجربة العديد من الإخفاقات، كما أن الوقت والتكاليف الاقتصادية باهظة.
من الواضح أن DeepSeek متمرد. وسط الضجة القائلة بأن تقنيات النماذج الكبيرة ستتقارب حتمًا وتتبعها هو اختصار أكثر ذكاءً، تقدر DeepSeek القيمة المتراكمة في "التحويلات" وتعتقد أنه بالإضافة إلى ابتكار التطبيقات، يمكن لرواد الأعمال النموذجيين الكبار في الصين أيضًا الانضمام إلى الابتكار التكنولوجي العالمي. السيل.
تعتبر العديد من اختيارات DeepSeek فريدة من نوعها. اعتبارًا من الآن، من بين 7 شركات ناشئة نموذجية واسعة النطاق في الصين، هي الشركة الوحيدة التي تخلت عن طريق "الحاجة والرغبة" وركزت على البحث والتكنولوجيا دون القيام بتطبيقات toC التي لم تفكر بشكل كامل في التسويق واختارت بحزم أن هناك شركات لم تقم حتى بجمع رأس المال على الطريق مفتوح المصدر. وهذا يجعلها غالبًا ما تُنسى خارج طاولة البوكر، ولكن على الجانب الآخر، غالبًا ما يتم نشرها من قبل المستخدمين في المجتمع مثل "مياه الصنبور".
كيف يتم إنشاء DeepSeek؟ ولهذا الغرض، أجرينا مقابلة مع Liang Wenfeng، مؤسس DeepSeek الذي نادرًا ما يظهر.
مؤسس ما بعد الثمانينيات، الذي كان يدرس التكنولوجيا خلف الكواليس منذ عصر Magic Square، لا يزال يواصل أسلوبه البسيط في عصر DeepSeek، و كلهم، مثل الباحثين، "يقرأون الأوراق البحثية، ويكتبون التعليمات البرمجية، ويشاركون في المناقشات الجماعية" كل يوم.
يتمتع العديد من مؤسسي الصناديق الكمية بخبرة في صناديق التحوط في الخارج، وتخصص معظمهم في الفيزياء والرياضيات وما إلى ذلك. والفرق هو أن Liang Wenfeng كان دائمًا من أصل صيني خلفية محلية ودرس في السنوات الأولى وهو أيضًا اتجاه الذكاء الاصطناعي في قسم الهندسة الإلكترونية بجامعة تشجيانغ.
أخبرنا العديد من المطلعين على الصناعة وباحثي DeepSeek أن Liang Wenfeng هو شخص نادر جدًا في صناعة الذكاء الاصطناعي الصينية الحالية "يتمتع بقدرات قوية في مجال هندسة الأشعة تحت الحمراء وأبحاث نموذجية". يتمتع أيضًا بقدرات قوية في مجال هندسة البنية التحتية وقدرات بحثية نموذجية. "شخص يمكنه تعبئة الموارد" و"يمكنه إصدار أحكام دقيقة من مكان مرتفع ويكون أفضل من الباحثين في الخطوط الأمامية في التفاصيل". لديه "قدرة تعليمية مرعبة". " وفي الوقت نفسه "لا يبدو كرئيس على الإطلاق، ولكنه أشبه بالرئيس." مثل المهوس".
هذه مقابلة نادرة بشكل خاص. في المقابلة، قدم هذا المثالي التقني صوتًا نادرًا بشكل خاص في دوائر العلوم والتكنولوجيا في الصين:إنه أحد الأشخاص القلائل الذين يضعون "وجهة نظر الصواب والخطأ" قبل "وجهة نظر المصالح" ويذكّرون لنا أن نرى العصر الجمود، الشخص الذي يضع "الابتكار الأصلي" على جدول الأعمال.
قبل عام، عندما انتهى برنامج DeepSeek للتو، أجرينا مقابلة مع Liang Wenfeng للمرة الأولى: "Crazy Magic Square: أحد نماذج كبيرة من "طريق" عملاق غير مرئي للذكاء الاصطناعي. إذا كان شعار "كن طموحًا إلى حد الجنون وصادقًا إلى حد الجنون" لا يزال شعارًا جميلاً في ذلك الوقت، فقد أصبح بعد عام واحد بمثابة فعل.
ما يلي هو جزء الحوار
حرب الأسعار كيف تم إطلاق الطلقة الأولى؟
"Undercurrent": بعد إصدار نموذج DeepSeek V2، سرعان ما أشعل البعض حرب أسعار دموية واسعة النطاق يقول الناس أنك سمك السلور في هذه الصناعة.
Liang Wenfeng: لم نقصد أن نصبح سمك السلور، لقد أصبحنا كذلك بالصدفة.
"التيار الخفي": هل تفاجئك هذه النتيجة؟
Liang Wenfeng: غير متوقع للغاية. لم أكن أتوقع أن السعر سيجعل الجميع حساسين لهذه الدرجة. نحن فقط نفعل الأشياء بالسرعة التي تناسبنا ونحسب تسعير التكلفة. مبدأنا ليس التبرع بالمال أو تحقيق أرباح ضخمة. هذا السعر هو أيضًا ربح طفيف أعلى من التكلفة.
"Undercurrent": تابعت Zhipu AI بعد 5 أيام، تليها Byte وAlibaba وBaidu وTencent وغيرها من الشركات المصنعة الكبرى.
Liang Wenfeng: Zhipu AI هو منتج مبتدئ، ولا تزال النماذج من نفس المستوى الذي لدينا تشحن الكثير من المال باهظ الثمن. كان بايت حقًا أول من تبعه. انخفض الطراز الرئيسي إلى نفس سعر طرازنا، الأمر الذي دفع الشركات المصنعة الكبرى الأخرى إلى خفض أسعارها. ولأن تكلفة النماذج من كبرى الشركات المصنعة أعلى بكثير من مثيلاتها لدينا، لم نتوقع أن يخسر أحد المال بفعل ذلك، وفي النهاية أصبح هذا منطق دعم حرق الأموال في عصر الإنترنت.
"Undercurrent": من الخارج، تبدو تخفيضات الأسعار وكأنها محاولة لجذب المستخدمين، وهو ما يحدث عادةً في حروب الأسعار في عصر الإنترنت.
Liang Wenfeng: التقاط المستخدمين ليس هدفنا الرئيسي. من ناحية، قمنا بتخفيض السعر لأننا نستكشف هيكل نموذج الجيل التالي، وقد انخفضت التكلفة أولاً، ومن ناحية أخرى، نشعر أيضًا أن واجهة برمجة التطبيقات (API) والذكاء الاصطناعي (AI) يجب أن تكون عالمية وبأسعار معقولة للجميع.
"Undercurrent": قبل ذلك، كانت معظم الشركات الصينية تنسخ هذا الجيل من هيكل اللاما مباشرة للتطبيقات. لماذا بدأت من هيكل النموذج؟ يقطع؟
Liang Wenfeng: إذا كان الهدف هو تقديم الطلبات، فاستخدم بنية اللاما وقصيرة ومسطحة وسريعة المنتجات هي أيضًا خيار معقول. لكن وجهتنا هي الذكاء الاصطناعي العام، مما يعني أننا بحاجة إلى دراسة هياكل نموذجية جديدة لتحقيق قدرات نموذجية أقوى في ظل موارد محدودة. هذه إحدى الدراسات الأساسية المطلوبة للارتقاء إلى نموذج أكبر. بالإضافة إلى بنية النموذج، قمنا أيضًا بالكثير من الأبحاث الأخرى، بما في ذلك كيفية هيكلة البيانات، وكيفية جعل النموذج أشبه بالبشر، وما إلى ذلك، والتي تنعكس جميعها في النماذج التي أصدرناها. بالإضافة إلى ذلك، تشير التقديرات إلى أن هيكل اللاما متخلف بجيلين عن المستويات الأجنبية المتقدمة من حيث كفاءة التدريب وتكلفة الاستدلال.
"التيار الخفي": من أين تأتي هذه الفجوة بين الأجيال بشكل أساسي؟
Liang Wenfeng: أولاً وقبل كل شيء، هناك فجوة في كفاءة التدريب. نحن نقدر أن بنية النموذج وديناميكيات التدريب قد تكون مختلفة مرتين بين أفضل النماذج المحلية وأفضل النماذج الأجنبية. ولهذا السبب وحده، يتعين علينا استهلاك ضعف قوة الحوسبة لتحقيق نفس التأثير. بالإضافة إلى ذلك، قد تكون هناك فجوة مضاعفة في كفاءة البيانات، مما يعني أنه يتعين علينا استهلاك ضعف بيانات التدريب وقوة الحوسبة لتحقيق نفس التأثير. وإجمالاً، فإنه يستهلك طاقة حاسوبية أكبر بأربع مرات. وما يتعين علينا القيام به هو الاستمرار في تضييق هذه الفجوات.
"Undercurrent": تختار معظم الشركات الصينية أن يكون لديها نماذج وتطبيقات. لماذا يختار DeepSeek حاليًا إجراء البحث والاستكشاف فقط؟
Liang Wenfeng: لأننا نشعر أن الشيء الأكثر أهمية الآن هو المشاركة في موجة الابتكار العالمي. في السنوات العديدة الماضية، اعتادت الشركات الصينية على قيام الآخرين بابتكارات تكنولوجية واستخدامنا لها لتحقيق الدخل من التطبيقات، لكن هذا ليس أمرًا طبيعيًا. في هذه الموجة، نقطة انطلاقنا ليست الاستفادة من الفرصة لتكوين ثروة، بل الذهاب إلى طليعة التكنولوجيا لتعزيز تطوير النظام البيئي بأكمله.
"Undercurrent": التصور الخامل المتبقي لمعظم الناس في عصر الإنترنت والإنترنت عبر الهاتف المحمول هو أن الولايات المتحدة جيدة في الابتكار التكنولوجي، وأنها والصين أفضل في تقديم الطلبات.
Liang Wenfeng: نعتقد أنه مع التنمية الاقتصادية،ستصبح الصين مساهمًا تدريجيًا، وليس دائمًا المشي لمسافات طويلة. في موجة تكنولوجيا المعلومات خلال الثلاثين عامًا الماضية أو نحو ذلك، لم نشارك بشكل أساسي في الابتكار التكنولوجي الحقيقي. لقد اعتدنا على سقوط قانون مور من السماء، وسوف تظهر لنا أجهزة وبرامج أفضل بعد البقاء في المنزل لمدة ثمانية عشر شهراً. يتم التعامل مع قانون القياس أيضًا بهذه الطريقة.
ولكن في الواقع، هذا هو ما عمل مجتمع التكنولوجيا الذي يهيمن عليه الغرب بلا كلل على خلقه لأجيال، فقط لأننا لم نشارك في هذا عملية من قبل، لذلك تجاهلنا وجودها.
الفجوة الحقيقية ليست سنة أو سنتين، بل الفرق بين الأصالة والتقليد
"Undercurrent": لماذا يفاجئ DeepSeek V2 الكثير من الأشخاص في وادي السيليكون؟
Liang Wenfeng: من بين العدد الكبير من الابتكارات التي تحدث كل يوم في الولايات المتحدة، يعد هذا أمرًا رائعًا للغاية مشترك. وكان سبب دهشتهم هو انضمام شركة صينية إلى لعبتهم كمساهم مبتكر. ففي نهاية المطاف، اعتادت أغلب الشركات الصينية على المتابعة بدلاً من الابتكار.
"التيار الخفي": لكن هذا الاختيار مبالغ فيه للغاية في السياق الصيني. النموذج الكبير عبارة عن لعبة استثمارية ضخمة، ولا تمتلك جميع الشركات رأس المال اللازم للبحث في الابتكار فقط دون التفكير أولاً في تسويقه.
Liang Wenfeng: من المؤكد أن تكلفة الابتكار ليست منخفضة، كما أن الجمود السابق للتخصيص لا يتوافق أيضًا مع الظروف الوطنية الماضية. لكن الآن، سواء نظرت إلى الحجم الاقتصادي للصين أو إلى أرباح الشركات الكبرى مثل بايت وتينسنت، فهي ليست منخفضة في العالم. ما نفتقر إليه في الابتكار ليس رأس المال بالتأكيد، بل الافتقار إلى الثقة وعدم معرفة كيفية تنظيم المواهب عالية الكثافة لتحقيق الابتكار الفعال.
"Undercurrent": لماذا من السهل جدًا على الشركات الصينية، بما في ذلك الشركات الكبيرة التي لا تعاني من نقص المال، إعطاء الأولوية للتسويق التجاري السريع؟
Liang Wenfeng: في الثلاثين عامًا الماضية، ركزنا فقط على كسب المال وتجاهلنا الابتكار. لا يعتمد الابتكار بالكامل على الأعمال، ولكنه يتطلب أيضًا الفضول والإبداع. نحن مقيدون فقط بجمود الماضي، ولكنها أيضًا مرحلة.
"Undercurrent": ولكن في النهاية، أنت مؤسسة تجارية، وليس مؤسسة بحثية علمية ذات منفعة عامة إذا اخترت الابتكار ومشاركتها من خلال المصدر المفتوح، ثم أين تشكل الخندق؟ الابتكارات مثل بنية MLA في مايو سيتم نسخها قريبًا من قبل شركات أخرى، أليس كذلك؟
ليانج وينفينج: في مواجهةالتقنيات الثورية، فإن الخندق الذي يتكون من مصدر مغلق قصير عاش. حتى لو كان OpenAI مغلق المصدر، فلا يمكنه منع الآخرين من تجاوزه. لذا فإننا نودع قيمة في الفريق. ينمو زملاؤنا في هذه العملية، ويتراكم لديهم الكثير من المعرفة، ويشكلون منظمة وثقافة يمكنها الابتكار، وهذا هو خندقنا.
مفتوح المصدر ونشر الأوراق، في الواقع، لا شيء يضيع. بالنسبة للموظفين الفنيين، فإن المتابعة هي شعور كبير بالإنجاز. في الواقع، المصدر المفتوح هو سلوك ثقافي أكثر منه سلوكًا تجاريًا. العطاء هو في الواقع شرف إضافي. الشركة التي تقوم بذلك سيكون لها أيضًا جاذبية ثقافية.
"Undercurrent": ما رأيك في المؤمنين بالسوق مثل Zhu Xiaohu؟
Liang Wenfeng: Zhu Xiaohu متسق مع نفسه، لكن أسلوبه في اللعب مناسب أكثر للشركات التي تصنع المال بسرعة، وبالنظر إلى الشركات الأكثر ربحية في الولايات المتحدة، فهي جميعها شركات ذات تقنية عالية ولها تاريخ طويل من التطور.
"Undercurrent": ولكن عندما يتعلق الأمر بالنماذج واسعة النطاق، فمن الصعب تكوين ميزة مطلقة بمجرد الريادة في التكنولوجيا الأكبر الشيء الذي تراهن عليه هو ما؟
ليانغ ونفينغ: ما نراه هو أن الذكاء الاصطناعي الصيني لا يمكن أن يكون دائمًا في وضع المتابعة. كثيرًا ما نقول إن هناك فجوة لمدة عام أو عامين بين الذكاء الاصطناعي في الصين والولايات المتحدة، لكن الفجوة الحقيقية هي الفرق بين الأصالة والتقليد. وإذا لم يتغير هذا، فستظل الصين تابعة دائمًا، لذلك لا يمكن الهروب من بعض الاستكشافات.
إن قيادة NVIDIA ليست مجرد جهود شركة واحدة، ولكنها نتيجة للجهود المشتركة لمجتمع التكنولوجيا الغربية والصناعة بأكملها. يمكنهم رؤية الجيل القادم من اتجاهات التكنولوجيا ولديهم خريطة طريق في متناول اليد. ويتطلب تطوير الذكاء الاصطناعي في الصين أيضًا مثل هذا النظام البيئي. لا يمكن للعديد من الرقائق المحلية أن تتطور بسبب الافتقار إلى المجتمعات التقنية الداعمة والمعلومات المستعملة فقط، لذلك يجب أن يكون لدى الصين شخص ما في طليعة التكنولوجيا.
المزيد من الاستثمار لا يؤدي بالضرورة إلى المزيد من الابتكار
< strong>"Undercurrent": يتمتع DeepSeek اليوم بمزاج مثالي منذ الأيام الأولى لـ OpenAI، كما أنه مفتوح المصدر. هل ستختار المصدر المغلق في المستقبل؟ لقد مر كل من OpenAI وMistral بعملية الانتقال من المصدر المفتوح إلى المصدر المغلق.
Liang Wenfeng: لن نغلق المصدر. نحن نؤمن أنه من الأهم أن يكون لديك نظام بيئي تقني قوي أولاً.
"Undercurrent": هل لديك خطة تمويل؟ وفقًا لتقارير وسائل الإعلام، تخطط شركة Huanfang لفصل شركة DeepSeek وإدراجها بشكل مستقل، وستكون شركات الذكاء الاصطناعي الناشئة في وادي السيليكون حتمًا مرتبطة بالشركات المصنعة الكبرى في النهاية.
Liang Wenfeng: لا توجد خطة تمويل على المدى القصير. المشكلة التي نواجهها لم تكن المال على الإطلاق. ولكن الحظر المفروض على نقل الرقائق الراقية.
"Undercurrent": يعتقد الكثير من الناس أن القيام بالذكاء الاصطناعي العام والقياس الكمي هما شيئان مختلفان تمامًا يمكن إجراؤهما بهدوء، ولكن قد يحتاج الذكاء الاصطناعي العام إلى ذلك حارب عاليًا وشكل تحالفات، مما قد يجعل استثمارك أكبر.
ليانغ ونفينغ: المزيد من الاستثمار لا يؤدي بالضرورة إلى المزيد من الابتكار. وبخلاف ذلك، يمكن للمصنعين الكبار الاستيلاء على جميع الابتكارات.
"Undercurrent": أنت لا تقوم بإنشاء تطبيقات الآن، هل هذا لأنك لا تملك الجينات اللازمة للعمل؟
Liang Wenfeng: نعتقد أن المرحلة الحالية هي فترة انفجار للابتكار التكنولوجي، وليست فترة انفجار للابتكار التكنولوجي. التطبيقات. على المدى الطويل، نأمل في تشكيل نظام بيئي تستخدم فيه الصناعة تقنيتنا ومخرجاتنا بشكل مباشر. نحن مسؤولون فقط عن النماذج الأساسية والابتكارات المتطورة، ومن ثم تقوم الشركات الأخرى ببناء أعمال toB وtoC استنادًا إلى DeepSeek. إذا تمكنا من تشكيل صناعة متكاملة في المراحل الأولية والنهائية، فلن نحتاج إلى تقديم التطبيقات بأنفسنا. وبطبيعة الحال، إذا لزم الأمر، ليس هناك أي عائق أمامنا لتطبيقه، ولكن البحث والابتكار التكنولوجي سيكون دائما أولويتنا الأولى.
"Undercurrent": ولكن إذا اخترت API، فلماذا تختار DeepSeek بدلاً من الشركات المصنعة الكبرى؟
Liang Wenfeng: من المرجح أن يكون عالم المستقبل متخصصًا في تقسيم العمل. تتطلب النماذج الكبيرة الأساسية ابتكارًا مستمرًا الشركات المصنعة الكبيرة لها حدود قدراتها الخاصة وقد لا تكون مناسبة.
"Undercurrent": لكن هل تستطيع التكنولوجيا بالفعل توسيع الفجوة؟ لقد قلت أيضًا إنه لا توجد أسرار تقنية مطلقة.
Liang Wenfeng: ليس هناك سر في التكنولوجيا، ولكن إعادة الضبط تتطلب وقتًا وتكلفة. من الناحية النظرية، لا تحتوي بطاقات رسومات Nvidia على أي أسرار تقنية ويسهل نسخها، لكن الأمر يستغرق وقتًا لإعادة تنظيم الفريق ومواكبة تكنولوجيا الجيل التالي، وبالتالي فإن الخندق الفعلي لا يزال واسعًا جدًا.
"Undercurrent": بعد قيامك بتخفيض الأسعار، قامت شركة Byte بالمتابعة أولاً، مما يدل على أنهم ما زالوا يشعرون بنوع من التهديد. ما رأيك في الحل الجديد للشركات الناشئة لمنافسة الشركات الكبرى؟
Liang Wenfeng: لأكون صادقًا، نحن لا نهتم كثيرًا بهذا الأمر، لقد فعلنا ذلك فقط من خلال الطريق. إن توفير الخدمات السحابية ليس هدفنا الرئيسي. هدفنا لا يزال هو تحقيق الذكاء الاصطناعي العام.
لم أر أي حلول جديدة حتى الآن، لكن الشركات المصنعة الكبرى ليس لديها ميزة واضحة. لدى الشركات المصنعة الكبرى مستخدمون جاهزون، لكن أعمال التدفق النقدي الخاصة بهم تشكل أيضًا عبئًا، مما يجعلها عرضة للتخريب في أي وقت.
"Undercurrent": ما رأيك في نتائج الشركات الناشئة الستة ذات النماذج الكبيرة إلى جانب DeepSeek؟
Liang Wenfeng: ربما ستنجو 2 إلى 3 عائلات. نحن لا نزال في مرحلة حرق الأموال، لذا فإن أولئك الذين لديهم تحديد موضع ذاتي واضح وعمليات أكثر دقة لديهم فرصة أفضل للبقاء على قيد الحياة. قد يتم إعادة اختراع شركات أخرى. الأشياء ذات القيمة لن تختفي، لكنها ستتغير.
"التيار الخفي": في عصر المربع السحري، تم تقييم الموقف تجاه المنافسة على أنه "يسير في طريقه الخاص"، ولم يتم إيلاء سوى القليل من الاهتمام له المقارنات الأفقية فيما يتعلق بالمنافسة، ما هي نقطة البداية في تفكيرك؟
Liang Wenfeng: ما أفكر فيه غالبًا هو ما إذا كان شيء ما يمكن أن يجعل المجتمع أكثر كفاءة، وأنت ما إذا كان الأمر كذلك يمكن أن تجد مكانة جيدة في التقسيم الصناعي لسلسلة العمل. وما دامت النتيجة النهائية هي جعل المجتمع أكثر كفاءة، فهذا أمر صحيح. هناك العديد من المراحل بينهما، والاهتمام المفرط سيجعلك تشعر بالدوار حتمًا.
مجموعة من الشباب الذين يقومون بأشياء "لا يمكن فهمها"
"Undercurrent": يعتقد جاك كلارك، مدير السياسات السابق في OpenAI والمؤسس المشارك لشركة Anthropic، أن DeepSeek استأجرت "مجموعة من السحرة الذين لا يمكن التنبؤ بهم". ما نوع الأشخاص الذين صنعوا DeepSeek v2؟
Liang Wenfeng: لا يوجد عباقرة غامضون، فكلهم خريجون حديثون من أفضل الجامعات ومتدربون حاصلون على درجة الدكتوراه 4 و 5، بالإضافة إلى بعض الشباب الذين لم يتخرجوا إلا منذ سنوات قليلة.
"Undercurrent": العديد من الشركات النموذجية الكبيرة مستمرة في اصطياد الأشخاص في الخارج. يعتقد الكثير من الناس أن أفضل 50 موهبة في هذا المجال قد تكون جميعها للشركات التي ليست في الصين، من أين يأتي شعبك؟
Liang Wenfeng: لا يوجد أشخاص عادوا من الخارج في نموذج V2، كلهم محليون. قد لا تكون أفضل 50 موهبة في الصين، ولكن ربما يمكننا بناء مثل هؤلاء الأشخاص بأنفسنا.
"Undercurrent": كيف حدث ابتكار MLA هذا؟ سمعت أن الفكرة جاءت في البداية من مصلحة شخصية لباحث شاب؟
Liang Wenfeng: بعد تلخيص بعض التغييرات السائدة في بنية Attention، أراد فجأة تصميم بديل . يخطط. ومع ذلك، فهي عملية طويلة من الفكرة إلى التنفيذ. لقد شكلنا فريقًا لهذا الأمر واستغرق الأمر عدة أشهر لإنجازه.
"Undercurrent": يرتبط ميلاد هذا الإلهام المتباين ارتباطًا وثيقًا بهيكل مؤسستك المبتكرة تمامًا. في عصر المربع السحري، نادرًا ما تقوم بتعيين الأهداف أو المهام من الأعلى إلى الأسفل. ولكن هل يتطلب الذكاء الاصطناعي العام، وهو استكشاف حدودي مليء بعدم اليقين، المزيد من الإجراءات الإدارية؟
Liang Wenfeng: DeepSeek هو أيضًا من القاعدة إلى القمة. علاوة على ذلك، فإننا لا نقترح عمومًا تقسيم العمل مسبقًا، بل التقسيم الطبيعي للعمل. كل شخص لديه تجربة نمو فريدة خاصة به ويأتي بأفكاره الخاصة، لذلك ليست هناك حاجة لدفعهم. أثناء عملية الاستكشاف، عندما يواجه مشاكل، فإنه سيدعو الآخرين لمناقشتها. ولكن عندما تظهر فكرة ما إمكاناتها، فسوف نقوم بتخصيص الموارد من الأعلى إلى الأسفل.
"Undercurrent": سمعت أن DeepSeek مرن للغاية في تعبئة البطاقات والأشخاص.
Liang Wenfeng: لا يوجد حد أعلى لكل واحد منا لنقل البطاقات والأشخاص. إذا كانت لديك فكرة، فيمكن للجميع الاتصال ببطاقة المجموعة التدريبية في أي وقت دون موافقة. وفي الوقت نفسه، نظرًا لعدم وجود تسلسلات هرمية وأقسام مشتركة، يمكن استدعاء الجميع بمرونة طالما أن الطرف الآخر مهتم أيضًا.
"Undercurrent": تعتمد طريقة الإدارة الفضفاضة أيضًا على اختيارك لمجموعة من الأشخاص الذين يقودهم الحب القوي. سمعت أنك جيد جدًا في توظيف الأشخاص بناءً على التفاصيل، ويمكنك اختيار الأشخاص المتميزين بناءً على مؤشرات التقييم غير التقليدية.
Liang Wenfeng: كانت معاييرنا لاختيار الأشخاص دائمًا هي الحب والفضول، لذلك يتمتع الكثير من الأشخاص ببعض الخصائص المميزة. كانت التجربة ممتعة للغاية. يرغب العديد من الأشخاص في إجراء الأبحاث أكثر بكثير من اهتمامهم بالمال.
"Undercurrent": وُلد Transformer في مختبر الذكاء الاصطناعي التابع لشركة Google، وولد ChatGPT في OpenAI، هل تعتقد أن AILab شركة كبيرة و هل تعتبر الشركة الناشئة مهمة للابتكار؟ ما الفرق في القيمة الناتجة؟
Liang Wenfeng: سواء كانت Google Labs أو OpenAI أو حتى AI Labs التابعة لكبرى الشركات المصنعة الصينية فهي ذات قيمة كبيرة. في النهاية، نجحت OpenAI في تحقيق ذلك، وكان ذلك أيضًا بمثابة حادث تاريخي.
"التيار الخفي": هل الابتكار مجرد حادث إلى حد كبير؟ أرى أن صف قاعات الاجتماعات الموجود في منتصف منطقة مكتبك به أبواب على اليسار واليمين يمكن فتحها حسب الرغبة. قال زملائك أن هذا من أجل ترك مجال للصدفة. في ولادة المحول، كانت هناك قصة سمع عنها الأشخاص المارة بالصدفة وانضموا إليها، وحولوها في النهاية إلى إطار عالمي.
Liang Wenfeng: أعتقد أن الابتكار هو في المقام الأول مسألة اعتقاد. لماذا يعد وادي السليكون مبتكرًا إلى هذا الحد؟ الأول هو أن يجرؤ. عندما ظهر تطبيق Chatgpt، كانت البلاد بأكملها تفتقر إلى الثقة في الابتكارات المتطورة، من المستثمرين إلى كبار المصنعين، شعر الجميع أن الفجوة كانت كبيرة جدًا، لذا يجب عليهم فقط تقديم الطلبات. لكن الابتكار يتطلب الثقة أولاً. عادة ما تكون هذه الثقة أكثر وضوحًا عند الشباب.
"Undercurrent": لكنك لا تشارك في التمويل ونادرًا ما تتحدث علنًا. من المؤكد أن صوتك الاجتماعي ليس بجودة تلك الشركات النشطة في التمويل كيفية ضمان DeepSeek هل هو الخيار الأول للأشخاص الذين يصنعون نماذج كبيرة؟
Liang Wenfeng: لأننا نقوم بالأمر الأكثر صعوبة. إن أكثر ما يجذب أفضل المواهب هو بالتأكيد حل أصعب المشكلات في العالم. في الواقع، يتم الاستهانة بالمواهب المتميزة في الصين. ونظراً لوجود عدد قليل للغاية من الابتكارات الأساسية على المستوى الاجتماعي بأكمله، فليس هناك أي فرصة للتعرف عليها. نحن نفعل أصعب شيء، وهو ما يجذبهم.
"Undercurrent": الإصدار السابق من OpenAI لم ينتظر GPT5. يعتقد الكثير من الناس أن هذا تباطؤ واضح في منحنى التكنولوجيا بدأ العديد من الأشخاص في التشكيك في قانون القياس، ما رأيك؟
Liang Wenfeng: نحن متفائلون، ويبدو أن الصناعة بأكملها تتماشى مع التوقعات. OpenAI ليس إلهًا ولا يمكن أن يكون دائمًا في المقدمة.
"Undercurrent": ما المدة التي تعتقد أن تحقيق الذكاء الاصطناعي العام سيستغرقها؟ قبل إطلاق DeepSeek V2، قمت بإصدار توليد الأكواد والنماذج الرياضية لقد تم تحويل النموذج الكثيف إلى MOE، فما هي إحداثيات خريطة طريق AGI الخاصة بك؟
Liang Wenfeng: قد يستغرق الأمر عامين أو 5 أعوام أو 10 أعوام. باختصار، سيتم تحقيقه في حياتنا. أما بالنسبة لخارطة الطريق، فلا يوجد إجماع حتى داخل شركتنا. لكننا راهنا في ثلاثة اتجاهات. الأول هو الرياضيات والرمز، والثاني هو تعدد الوسائط، والثالث هو اللغة الطبيعية نفسها. تعتبر الرياضيات والبرمجة بمثابة أرض اختبار طبيعية للذكاء الاصطناعي العام (AGI)، وهي تشبه إلى حد ما لغة Go، فهي عبارة عن نظام مغلق وقابل للتحقق، ومن الممكن تحقيق ذكاء عالٍ من خلال التعلم الذاتي. من ناحية أخرى، قد يكون التعلم متعدد الوسائط الذي يشمل البشر في العالم الحقيقي ضروريًا أيضًا للذكاء الاصطناعي العام. نحن منفتحون على كل الاحتمالات.
"Undercurrent": كيف ستكون نهاية النموذج الكبير برأيك؟
Liang Wenfeng: سيكون هناك شركات متخصصة تقدم النماذج الأساسية والخدمات الأساسية، وستكون هناك سلسلة طويلة التقسيم المهني للعمل. يمكن لعدد أكبر من الناس تلبية الاحتياجات المتنوعة للمجتمع ككل.
جميع الإجراءات هي منتجات من الجيل السابق
< قوي>"التيار الخفي": في العام الماضي، كانت هناك العديد من التغييرات في نموذج ريادة الأعمال الكبير في الصين، على سبيل المثال، انسحب وانغ هويوين، الذي كان نشطًا في بداية العام الماضي، من الشركة في منتصف المدة، والشركات التي كان يديرها. انضم في وقت لاحق بدأ في إظهار التمايز.
Liang Wenfeng: تحمل Wang Huiwen كل الخسائر بنفسه وترك الآخرين يهربون سالمين. لقد اتخذ خيارًا كان الأكثر ضررًا لنفسه ولكنه الأفضل للجميع، لذا فهو شخص لطيف جدًا، وأنا معجب به كثيرًا.
"التيار الخفي": أين تركز معظم طاقتك الآن؟
Liang Wenfeng: ينصب التركيز الرئيسي على البحث عن الجيل التالي من النماذج الكبيرة. لا يزال هناك الكثير من الأسئلة دون إجابة.
"Undercurrent": تصر العديد من الشركات الناشئة ذات النماذج الكبيرة على الحصول على كليهما، ففي نهاية المطاف، لن تجلب التكنولوجيا القيادة الدائمة اغتنام النافذة الزمنية لتطبيق المزايا التقنية على المنتجات. هل يجرؤ DeepSeek على التركيز على أبحاث النماذج لأن إمكانات النموذج ليست كافية؟
Liang Wenfeng: جميع الإجراءات الروتينية هي منتجات من الجيل السابق وقد لا تكون بالضرورة صحيحة في المستقبل. استخدم منطق الأعمال الخاص بالإنترنت لمناقشة نموذج الربح المستقبلي للذكاء الاصطناعي، تمامًا كما ناقشت شركتي جنرال إلكتريك وكوكا كولا عندما بدأ ما هواتينج عمله. من المحتمل أن يكون نوعًا من نحت قارب للبحث عن سيف.
"التيار الخفي": في الماضي، كان لدى Huanfang جينات تقنية وابتكارية قوية، وكان نموها سلسًا نسبيًا، ولهذا السبب أنت متفائل. ؟
Liang Wenfeng: لقد عززت Magic Square ثقتنا في الابتكار القائم على التكنولوجيا إلى حد ما، لكنها لا تفعل ذلك كلها طرق سلسة. لقد مررنا بعملية تراكم طويلة. ما نراه من الخارج هو جزء من Magic Square بعد عام 2015، ولكن في الواقع نحن نقوم بذلك منذ 16 عامًا.
"Undercurrent": العودة إلى موضوع الابتكار الأصلي. والآن بعد أن دخل الاقتصاد في مرحلة الركود ودخل رأس المال دورة باردة، فهل سيؤدي ذلك إلى فرض المزيد من القيود على الإبداع الأصلي؟
ليانغ ونفينغ: لا أعتقد ذلك. وسوف يعتمد تعديل الهيكل الصناعي في الصين بشكل أكبر على الابتكار في التكنولوجيات الأساسية. عندما يكتشف العديد من الأشخاص أن تحقيق المال السريع في الماضي كان على الأرجح نتيجة للحظ في ذلك الوقت، سيكونون أكثر استعدادًا للاعتماد على الابتكار الحقيقي والقيام به.
"Undercurrent": إذن أنت متفائل أيضًا بشأن هذا الأمر؟
Liang Wenfeng: لقد نشأت في مدينة من الدرجة الخامسة في مقاطعة Guangdong في الثمانينيات. كان والدي مدرسًا في مدرسة ابتدائية في التسعينيات، وكان هناك العديد من الفرص لكسب المال في قوانغدونغ، وفي ذلك الوقت، كان العديد من الآباء يعتقدون أن الدراسة عديمة الفائدة. ولكن إذا نظرنا إلى الوراء الآن، فقد تغيرت أفكاري. ونظرًا لصعوبة كسب المال، فقد لا تتاح لي الفرصة لقيادة سيارة أجرة. هذا يتغير في جيل واحد.
سيكون هناك المزيد والمزيد من الابتكارات الأساسية في المستقبل. قد لا يكون من السهل أن نفهم الآن لأن المجموعة الاجتماعية بأكملها بحاجة إلى التثقيف بشأن الحقائق. عندما يسمح هذا المجتمع للأشخاص المبتكرين بأن يصبحوا ناجحين، فإن التفكير الجماعي سوف يتغير. ما زلنا بحاجة إلى مجموعة من الحقائق والعملية.