المؤلف: الشبكة العالمية
في 27 يناير، تصدر تطبيق DeepSeek قائمة التطبيقات المجانية في شركة Apple في الولايات المتحدة. متجر التطبيقات: تجاوزت قائمة ترتيب التنزيلات ChatGPT في قائمة التنزيلات الأمريكية. وفي نفس اليوم، أظهرت القائمة المجانية لمتجر تطبيقات الصين التابع لشركة Apple أن DeepSeek احتل المرتبة الأولى في الصين.
متجر تطبيقات Apple الأمريكي
القائمة المجانية لمتجر تطبيقات Apple في الصين
27 ينايرتم تحديث بحث التجويف الصغير ذي الصلة الشاشة:
علق فنغ جي، المؤسس والرئيس التنفيذي لشركة Game Science، منتج "Black Myth: Wukong"، على DeepSeek: إنه قد تكون اللعبة وطنية على مستوى الإنجازات العلمية والتكنولوجية.
ما هو ديب سيك؟
DeepSeek، الاسم الكامل لشركة Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.، تأسست في 17 يوليو 2023. إنها تقنية مبتكرة شركة تركز على تطوير نماذج اللغات الكبيرة المتقدمة (LLMs) والتقنيات ذات الصلة. بعد إصدار DeepSeek-V3 في ديسمبر من العام الماضي، نشر ألكسندر وانغ، مؤسس شركة خدمات بيانات الذكاء الاصطناعي Scale AI، أن DeepSeek-V3 كان جلبها مجتمع التكنولوجيا الصيني إلى الولايات المتحدة درسًا مريرًا. "بينما تستريح الولايات المتحدة، تعمل الصين (مجتمع التكنولوجيا)، وتلحق بالركب بتكلفة أقل وسرعة أكبر وقوة أكبر."بعد أقل من شهر، في 20 يناير من هذا العام، قامت DeepSeek رسميًا بفتح نموذج الاستدلال R1. وفقًا لـ DeepSeek، يستخدم أحدث طراز DeepSeek-R1 تقنية التعلم المعزز على نطاق واسع في مرحلة ما بعد التدريب القليل من البيانات المصنفة، تحسنت قدرة النموذج على التفكير بشكل كبير. في مهام مثل الرياضيات والبرمجة واستدلال اللغة الطبيعية، يكون الأداء مشابهًا للإصدار الرسمي من OpenAI o1.
بعد إصدار هذا النموذج، أثار مناقشات بين العديد من عمالقة التكنولوجيا في دائرة الذكاء الاصطناعي في الخارج. على سبيل المثال، قام جيم فان، أحد كبار علماء الأبحاث في Nvidia، بالتغريد علنًا على منصته الاجتماعية الشخصية: "نحن في لحظة تاريخية: شركة غير أمريكية تواصل مهمة OpenAI الأصلية - لتمكين العالم من خلال أحدث التقنيات المفتوحة حقًا. قد يبدو الأمر غير بديهي، ولكن النهايات الأكثر إثارة للاهتمام غالبًا ما تكون هي الأكثر احتمالية أن تتحقق."
لماذا أصبح DeepSeek شائعًا فجأة؟
في اليوم السادس والعشرين، واجه DeepSeek عطلًا مفاجئًا قصير المدى. أبلغ العديد من مستخدمي الإنترنت أنهم واجهوا رسالة "الخادم مشغول" عند استخدامه. ردًا على ذلك، قالت DeepSeek إن تقلبات في الخدمة المحلية حدثت بعد ظهر ذلك اليوم، ولكن تم حل المشكلة في غضون دقائق. قد يرجع هذا الحادث إلى الزيادة الكبيرة في زيارات المستخدمين بعد إصدار النموذج الجديد، وكان الخادم غير قادر مؤقتًا على تلبية الاحتياجات المتزامنة لعدد كبير من المستخدمين. إلا أن صفحة الحالة الرسمية لم تصنف الحادث على أنه حادث.
كما فهمت، في السابق، لم يكن تصنيف DeepSeek في القائمة الأمريكية يتمتع بأداء متميز بشكل خاص، بل كان في مرحلة تصاعدية مطردة، لكنه لم يدخل المراكز العشرة الأولى. ويرتبط هذا الارتفاع المفاجئ ارتباطًا مباشرًا بسلسلة الأداء المتميز التي قدمتها مؤخرًا. بحسب صحيفة قوانغتشو ديلي، "يمكن إرجاع أسباب شعبية DeepSeek إلى نقطتين: الأداء والتكلفة." وقال الخبير الاقتصادي تشنغ لي للصحفيين. وأوضح DeepSeek أن R1 يستخدم تقنية التعلم المعزز على نطاق واسع في مرحلة ما بعد التدريب، مما يحسن بشكل كبير قدرات الاستدلال للنموذج باستخدام القليل جدًا من البيانات المصنفة. ولم يجذب هذا الأداء المتميز اهتمامًا واسع النطاق من مجتمع التكنولوجيا فحسب، بل سمح أيضًا لمجتمع الاستثمار برؤية إمكاناتها التجارية الضخمة. الأمر الأكثر إثارة للقلق هو أن ما يميز DeepSeek R1 حقًا هو تكلفته - أو بعبارة أخرى، تكلفته المنخفضة للغاية. تبلغ تكلفة التدريب المسبق لـ DeepSeek's R1 5.576 مليون دولار أمريكي فقط، وهو أقل من عُشر تكلفة التدريب لنموذج OpenAI GPT-4o. في الوقت نفسه، أعلنت DeepSeek عن تسعير واجهة برمجة التطبيقات (API)، وهو 1 يوان (ضربة ذاكرة التخزين المؤقت)/4 يوان (فشل ذاكرة التخزين المؤقت) لكل مليون رمز إدخال، و16 يوان لكل مليون رمز إخراج. تبلغ هذه الرسوم حوالي ثلاثين من تكلفة تشغيل OpenAI o1، لذلك يُطلق على DeepSeek اسم "Pinduoduo" في صناعة الذكاء الاصطناعي. صرح Zheng Lei بصراحة أنDeepSeek كان له تأثير كبير على سوق الأجهزة لأنه قد يقلل من تكلفة الأجهزة لنماذج الذكاء الاصطناعي وبالتالي تعزيز تطوير الذكاء الاصطناعي تكنولوجيا الذكاء< /قوي>. يضم الفريق أقل من 140 شخصًا، جميعهم من أفضل الجامعات المحلية
السبب لماذا يستطيع DeepSeek تحقيق هذه الابتكارات ليس إنجازًا ليوم واحد، بل نتيجة سنوات من "الحضانة" والتخطيط طويل المدى. Liang Wenfeng، مؤسس DeepSeek، هو أيضًا مؤسس Magic Square Quantitative، وهي شركة رائدة في مجال الأسهم الخاصة الكمية. تستفيد Deepseek بشكل كامل من الأموال والبيانات والبطاقات المتراكمة من خلال Magic Square Quantification.
تخرج ليانغ ون فنغ من جامعة تشجيانغ بدرجة البكالوريوس والدراسات العليا وحصل على درجة البكالوريوس ودرجة الماجستير من قسم المعلومات والهندسة الإلكترونية. منذ عام 2008، قاد فريقه لاستكشاف التداول الكمي الآلي بالكامل باستخدام التعلم الآلي والتقنيات الأخرى. في يوليو 2023، تم تأسيس DeepSeek رسميًا ودخلت مجال الذكاء الاصطناعي العام ولم تجمع تمويلًا خارجيًا أبدًا. في السابق، اعتقد جاك كلارك، مدير السياسات السابق في OpenAI والمؤسس المشارك لشركة Anthropic، أن DeepSeek استأجرت "مجموعة من السحرة الذين لا يمكن التنبؤ بهم". بخصوص هذا الأمر، تمت مقابلة Liang Wenfeng بواسطة وسائل الإعلام الذاتية كشف ذات مرة أنه لا يوجد عباقرة غامضون، كلهم خريجون من أفضل الجامعات، ومتدربون حاصلون على دكتوراه 4 ودكتوراه 5 ولم يتخرجوا، وبعضهم من الشباب تخرجت منذ سنوات قليلة فقط.
يمكن ملاحظة من تقارير وسائل الإعلام العامة الحالية أن أكبر خصائص فريق DeepSeek هي المرموقة والشباب. وحتى على مستوى قائد الفريق، فإن معظمهم أقل من 35 عامًا. مع فريق يضم أقل من 140 شخصًا، يأتي جميع المهندسين وموظفي البحث والتطوير تقريبًا من أفضل الجامعات المحلية مثل جامعة تسينغهوا، وجامعة بكين، وجامعة صن يات صن، وجامعة بكين للبريد والاتصالات. ، وساعات عملهم قصيرة. إضافي
تفسير الخبراء: الصين الجديدة لماذا تحظى نماذج الذكاء الاصطناعي الكبيرة بشعبية كبيرة عبر الإنترنت؟
في الآونة الأخيرة، أصبحت شركة صينية ناشئة في مجال الذكاء الاصطناعي تدعى DeepSeek واحدة من أكثر الشركات شهرة شركات الذكاء الاصطناعي (AI) في الداخل والخارج) هو موضوع يتم مناقشته بشدة في مجال النماذج الكبيرة. وفي أقل من 30 يومًا، أصدرت DeepSeek نموذجين كبيرين، DeepSeek-V3 وDeepSeek-R1، وتكلفتهما منخفضة مقارنة بمشاريع النماذج الأجنبية واسعة النطاق والتي غالبًا ما تكلف مئات الملايين أو حتى عشرات المليارات من الدولارات، كما أن أداءهما منخفض. يمكن مقارنتها بأعلى الموديلات الأجنبية الكبيرة. وفي الوقت نفسه، يختلف DeepSeek عن النهج المغلق المصدر لعمالقة النماذج الكبيرة الأجنبية ويتبنى نموذجًا مفتوح المصدر. لقد اجتذب نموذج التطوير والإنجازات التي حققتها هذه الشركة الصينية اهتمامًا كبيرًا في وادي السيليكون، ونشرت العديد من وسائل الإعلام الغربية الرئيسية مقالات تندب فيها أن "نماذج الذكاء الاصطناعي الصينية صدمت وادي السيليكون"، بل إنها أثارت "جنون" العديد من المشاهير المحليين والأجانب. الشركات المصنعة والمؤسسات تحاول إعادة إنتاج نتائج DeepSeek بين عشية وضحاها ". ما هي خصائص تطور DeepSeek؟ هل يجلب بعض الإلهام لمسار التطوير والأفكار المبتكرة للنماذج المحلية واسعة النطاق؟ أجرى مراسلو "جلوبال تايمز" مقابلات مع عدد من الخبراء في مجال الذكاء الاصطناعي يوم 26.
"منافس مفتوح وفعال من حيث التكلفة لـ OpenAI o1"
أصدرت DeepSeek النموذج الكبير R1 في العشرين من هذا الشهر، وذكرت أنه "في مهام مثل الرياضيات والبرمجة واستدلال اللغة الطبيعية، يكون أدائه مشابهًا للإصدار الرسمي من OpenAI o1". جذبت اهتمامًا كبيرًا من وسائل الإعلام الأجنبية، وخاصة وسائل الإعلام الأمريكية، لهذه الشركة الصينية وأحدث نتائجها النموذجية الكبيرة.
"لقد أثار نموذج الذكاء الاصطناعي الصيني الرخيص والمفتوح DeepSeek حماسة العلماء." أطلقت مجلة "Nature" هذا العنوان في الرابع والعشرين من الشهر الجاري، وهي اللغة الكبيرة التي طورها العلماء الصينيون حول نموذج DeepSeek-R1، الذي يعتبر منافسًا ميسور التكلفة ومفتوحًا لنماذج "الاستدلال" مثل OpenAI o1.
نشرت صحيفة "نيويورك تايمز" يوم 24 بعنوان "كيف تتنافس شركة DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي مع عمالقة وادي السيليكون"، قائلة إنها كذلك يعد تحقيق النتائج المذكورة أعلاه بالفعل إنجازًا رائعًا، لكن الفريق الذي يقف وراء النموذج الكبير DeepSeek-V3 يصف تقدمًا أكبر. لقد قاموا بتدريب النظام باستخدام جزء صغير فقط من رقائق الكمبيوتر عالية التخصص التي تستخدمها شركات الذكاء الاصطناعي المتقدمة. وقال المهندسون الصينيون إنهم أنفقوا حوالي 6 ملايين دولار أمريكي وحوالي 2000 شريحة خاصة من Nvidia فقط لاستكمال التدريب على النموذج الجديد، وكل من التمويل وحجم استخدام الرقائق أقل بكثير من شركات الذكاء الاصطناعي الرائدة في العالم.
"هذه ليست مشكلة لحاق الصين بالولايات المتحدة، ولكنها مشكلة لحاق المصادر المفتوحة بالمصادر المغلقة"
لقد اجتذب DeepSeek الكثير من الاهتمام بالإضافة إلى أدائه عالي التكلفة، هناك سبب آخر: المصدر المفتوح. في الأيام الأخيرة، كانت هناك موجة من إحياء DeepSeek على الإنترنت. لقد نجحت جامعة كاليفورنيا، بيركلي، وجامعة هونج كونج للعلوم والتكنولوجيا، وشركة الذكاء الاصطناعي المعروفة HuggingFace، وما إلى ذلك في إعادة إنتاجها بنجاح، باستخدام التعلم المعزز فقط دون ضبط دقيق تحت الإشراف، ويمكنها حتى إكمال عملية الاستنساخ في بتكلفة عشرات الدولارات فقط.
قال موقع Reddit الأمريكي يوم 25 إن نموذج DeepSeek الصيني مفتوح المصدر، وهذا هو السبب الحقيقي للإثارة. في الأساس، إنهم يصنعون المعرفة اللازمة لجعل هذه الأشياء متاحة مجانًا للعالم، مما يضمن أنه لا يمكن لأحد أن يحتكرها حقًا. الشركات الصينية تفعل بشكل أساسي عكس ما تفعله الشركات الأمريكية. هل يمكنك رؤية أي نماذج قوية مفتوحة المصدر من OpenAI أو Anthropic أو Google؟ حتى الآن، قمنا فقط بخدش السطح منها. Meta هي الشركة الغربية الكبرى الوحيدة التي قدمت مساهمة كبيرة في النماذج الكبيرة مفتوحة المصدر، لكنها قد لا تفتح أفضل نماذجها في المستقبل. قال يان ليكون، المعروف كأحد "عمالقة التعلم العميق الثلاثة"، على منصة التواصل الاجتماعي X إن هذه ليست مشكلة لحاق الصين بالولايات المتحدة، ولكنها مشكلة لحاق المصدر المفتوح بالمصدر المغلق.
قال ليو وي، مدير التفاعل بين الإنسان والحاسوب ومختبر الهندسة المعرفية بجامعة بكين للبريد والاتصالات، في مقابلة مع مراسل من صحيفة جلوبال تايمز أن العناصر الأساسية الثلاثة للنموذج الكبير هي البيانات والخوارزميات وقوة الحوسبة. يستخدم Deepseek بيانات أقل وقوة حوسبة أقل، وقد حقق نتائج تعادل أو حتى أفضل من النماذج الأجنبية الكبيرة المعروفة. وهذا أمر يستحق الاعتراف. وفي الوقت نفسه، يجب علينا أيضًا أن نرى أنه مفتوح المصدر ويمكن استخدامه وإعادة إنتاجه من قبل المستخدمين حول العالم الذين يرغبون في استخدام هذا النموذج الكبير.
أخبر شنيانغ، الأستاذ في كلية الصحافة وكلية الذكاء الاصطناعي بجامعة تسينغهوا، مراسلًا من صحيفة جلوبال تايمز يوم السادس والعشرين أن نموذج DeepSeek الكبير هو متميز جدًا بين النماذج الكبيرة مفتوحة المصدر في العالم، أحدهما هو الاستخدام المختلط لتقنيات متقدمة متعددة لتحقيق اختراقات مبتكرة تتجاوز تكنولوجيا التدريب المسبق التقليدية. وتحدث عن عدة مميزات لهذا النموذج الكبير من منطلق تجربته الخاصة في استخدامه. أولا، فهو يجمع بين الأساليب الحالية لتحسين قدرات نماذج الذكاء الاصطناعي الكبيرة والابتكارات الهندسية الدقيقة. ثانيًا، قامت شركة DeepSeek بنشر الأبحاث ذات الصلة، ويمكن للجميع إعادة إنتاج العملية بأكملها. وهذه هي قوة المصدر المفتوح. ثالثًا، تتمتع عملية التفكير التي يقوم بها DeepSeek بابتكاراتها الخاصة. بصفته باحثًا في مجال الذكاء الاصطناعي، استخدم شنيانغ الذكاء الاصطناعي أكثر من 30 ألف مرة، ويعتقد أنه بالمقارنة مع الذكاء الاصطناعي الأمريكي، لا يزال DeepSeek يحتوي على العديد من العناصر الصينية، مثل بعض الكلمات الساخنة على الإنترنت الصينية.
تحسين مهارات التفكير
أما بالنسبة للتنوير المهم الذي يوفره نموذج تطوير Deepseek لتطوير وابتكار النماذج الكبيرة المحلية، يعتقد ليو وي أن "الابتكار ليس مخططًا له، فهو يتطلب من السوق والمؤسسات المهنية إيجاد طرق جديدة من خلال البحث طويل المدى خاصة بالنسبة لبعض الشركات التجارية التي كانت تهتم بالمجالات الرأسية لفترة طويلة، يمكنها العثور على نقاط ابتكار أفضل من خلال التفكير في مسارات التكنولوجيا والشعور بتطور السوق. وينطبق الشيء نفسه على عملية التطوير الأولية لـ OpenAI، والتي لم تكن كذلك خطط لها المسؤولون الأمريكيون وعمالقة التكنولوجيا ”
قبل بضعة أيام، أعلنت OpenAI وSoftBank وشركات أخرى عن خطة "Stargate"، والتي ستنفق 500 مليار دولار أمريكي في أربع سنوات لتسريع تطوير الذكاء الاصطناعي في الولايات المتحدة. وأكد ليو وي أن هذا النوع من مسار التنمية الذي يركز على الموارد البشرية والمالية والمادية ومن ثم يعطي أفضليات السياسة سيكون به بعض الشكوك فيما يتعلق باتجاهات البحوث المستقبلية ونتائج البحوث. "لا يزال من الضروري تشجيع المزيد من الشركات التجارية المحلية ومعاهد البحث العلمي على التركيز على مجالات البحث الخاصة بها وإيجاد مسارات الابتكار والتطوير الخاصة بها."
شنيانغ قال إنه في تاريخ تطور الذكاء الاصطناعي، غالبًا ما تكون الإنجازات الجديدة مدفوعة بمزيج من الابتكار الهندسي غير المزعج والاستكشاف العلمي. وينعكس هذا الاتجاه بعمق في نتائج برنامج DeepSeek، الذي لا يخترق أساليب التدريب التقليدية فحسب، بل يقدم أيضًا منظورًا جديدًا لتحسين قدرات التفكير المنطقي. "على الرغم من أن إنجازاته لا تزال على مستوى المرحلة، إلا أن مساهماته الهندسية وابتكاراته النظرية قد أرست أساسًا مهمًا لتطوير الذكاء الاصطناعي في المستقبل." تكمن في دقة وكفاءة أساليبها الهندسية. يمثل هذا الابتكار الهندسي لـ DeepSeek مرحلة جديدة في التدريب على نماذج الذكاء الاصطناعي، والذي لا يقلل تكاليف التطوير فحسب، بل يوفر أيضًا طريقًا للشركات الأخرى للتعلم منه. وفي الوقت نفسه، ينعكس الابتكار الأساسي لـ DeepSeek أيضًا في تحسين قدرات الاستدلال، خاصة من خلال ابتكارات الخوارزميات ذات الصلة لتعزيز قدرات الاستدلال الطبيعي للنموذج، مما يثبت إمكاناته في مجال الذكاء الاصطناعي - دون عدد كبير من التفكير المكلف التعليقات التوضيحية المتسلسلة، لا يزال النموذج قادرًا على ظهور القدرة على التفكير.
تعتقد شنيانغ أن نجاح DeepSeek يسمح لنا أيضًا برؤية اتجاه التطوير المستقبلي لصناعة الذكاء الاصطناعي: المزيد من الابتكار مفتوح المصدر والتعاون المتعمق بين الأجهزة والبرامج، والتحسين المستمر لتكاليف تطوير النموذج وقدرات التفكير. وفي الوقت نفسه، يجب علينا أيضًا أن نرى أنه على الرغم من أن DeepSeek قد حقق نتائج أولية مهمة، إلا أنه لا يزال بحاجة إلى مواجهة العديد من التحديات العميقة من أجل تحقيق المزيد من الاختراقات في تطوره المستقبلي، مثل الحاجة إلى المزيد من بيانات التدريب والخوارزميات الأصلية. . ابتكار. ص>