DeepSeek تقدم الذكاء الاصطناعي الشفاف
شركة الذكاء الاصطناعي ومقرها الصين كشفت شركة DeepSeek عن أحدث نظام الذكاء الاصطناعي الخاص بها، DeepSeek-R1-Lite-Preview، مما يمثل تقدمًا كبيرًا في قدرات التفكير وحل المشكلات.
يتميز النظام، الذي تم وضعه كمنافس لنظام o1 التابع لشركة OpenAI، عن غيره من الأنظمة من خلال تعزيز الشفافية وتحسين الطريقة التي يعالج بها الاستعلامات المعقدة.
على عكس النماذج التقليدية، التي غالبًا ما تتجاهل الفروق الدقيقة، يخصص DeepSeek-R1-Lite مزيدًا من الوقت للتحقق من الحقائق والتفكير بعمق في الأسئلة، مما يقلل من الأخطاء الشائعة.
مماثل لOpenAI يخطط DeepSeek-R1، وهو روبوت o1، لاستجاباته خطوة بخطوة، ويقضي ما يصل إلى عشرات الثواني في الاستفسارات المعقدة لضمان الدقة.
وأشار المعلقون إلى المفارقة في شفافية DeepSeek، وخاصة عند مقارنتها بالنماذج الغربية التي لم تعالج بعد فجوات المنطق بشكل كامل.
وقد أظهرت النسخة الأحدث من DeepSeek بالفعل نتائج مذهلة في معايير حل المشكلات مثل اختبار الرياضيات الأمريكي (AIME) واختبار MATH، الذي يقيم الكفاءة الرياضية والمنطقية.
يضع هذا الأداء DeepSeek-R1 في موضع منافس جاد لـOpenAI 's ChatGPT ونموذج o1 المتخصص الخاص به.
مع الذكاء الاصطناعي التوليدي إن التقدم السريع وإطلاق DeepSeek-R1-Lite-Preview والتحديثات الأخيرة من Le Chat التابعة لشركة Mistral AI يشير إلى المنافسة المتزايدة في مجال الذكاء الاصطناعي، مما يدفع الشركات إلى معالجة نقاط الضعف وتقديم حلول أكثر قوة وشفافية.
DeepSeek يفوز في التفكير خطوة بخطوة
تسلط DeepSeek الضوء على قدرة الذكاء الاصطناعي على توفير التفكير خطوة بخطوة في الوقت الفعلي، مما يعزز الشفافية ويسمح للمستخدمين بفهم عملية تفكيرها بشكل أفضل.
وبالإضافة إلى هذه الميزة، تخطط الشركة لإصدار نموذج مفتوح المصدر وأدوات للمطورين من خلال واجهة برمجة التطبيقات في المستقبل القريب.
يُظهر مخطط مقارنة حديث أجراه خبير الذكاء الاصطناعي أندرو كوران أن DeepSeek-R1-Lite-Preview يتفوق على المنافسين مثل o1-preview من OpenAI و Claude 3.5 Sonnet في المقاييس الرئيسية مثل AIME (52.5) و Codeforces (1450)، بالإضافة إلى التفوق في مهام حل المشكلات المتقدمة مثل MATH-500 (91.6).
ومع ذلك، فإنها تتخلف في مجالات مثل GPQA Diamond (58.5) وZebra Logic (56.6)، حيث يحقق o1-preview من OpenAI أداءً أفضل، مسجلاً 73.3 و71.4 على التوالي.
تشير هذه الأرقام إلى أنه في حين أن DeepSeek'sمنظمة العفو الدولية وعلى الرغم من أن هذا البحث يظهر نتائج واعدة في بعض مجالات التفكير المتقدمة، إلا أنه لا يزال هناك مجال للتحسين في المعرفة العامة والتفكير المنطقي.
نماذج الذكاء الاصطناعي من المختبرات الكبرى تتحسن بشكل طفيف
أثار الذكاء الاصطناعي الخاص بشركة DeepSeek مخاوف بسبب قابليته للكسر، مما يسمح للمستخدمين بتفعيل النموذج بطرق تتجاوز ضماناته.
على سبيل المثال، واحدX (المعروف سابقًا باسم تويتر) تمكن المستخدم بنجاح من مطالبة الذكاء الاصطناعي بتوفير وصفة مفصلة للميثامفيتامين.
ومن ناحية أخرى، يتميز DeepSeek-R1 بحساسية خاصة للاستفسارات السياسية، وخاصة تلك المتعلقة بالقيادة الصينية، أو الأحداث مثل ميدان السلام السماوي، أو الموضوعات الجيوسياسية المثيرة للجدل مثل تايوان.
من المرجح أن ينبع هذا السلوك منالضغوط التنظيمية في الصين ، حيث يُطلب من نماذج الذكاء الاصطناعي الالتزام بـ "القيم الاشتراكية الأساسية" للحكومة والخضوع للتدقيق من قبل هيئة تنظيم الإنترنت في البلاد.
تشير التقارير إلى أن أنظمة الذكاء الاصطناعي في الصين غالباً ما تكون مقيدة باستخدام مصادر معينة، مما يؤدي إلى نماذج تتجنب الاستجابة للموضوعات السياسية الحساسة لضمان الامتثال لأوامر الدولة.
مع ظهور هذه التحديات التنظيمية، يقوم مجتمع الذكاء الاصطناعي الأوسع بإعادة تقييم المفهوم القديم المتمثل في "قوانين التوسع".
افترضت هذه النظرية أن زيادة البيانات وقوة الحوسبة من شأنها أن تعمل على تحسين أداء النموذج بشكل مستمر.
ومع ذلك، تشير التقارير الأخيرة إلى أن النماذج من المختبرات الكبرى مثل OpenAI،جوجل ولم تعد العلوم والتكنولوجيا والهندسة والرياضيات تظهر التقدم السريع الذي كانت تظهره في السابق.
وقد أدى هذا التحول إلى إطلاق عملية بحث عن مناهج وتقنيات وهندسة الذكاء الاصطناعي البديلة، بما في ذلك الحوسبة في وقت الاختبار - وهو ابتكار شوهد في نماذج مثل o1 و DeepSeek-R1.
تُعرف هذه الطريقة أيضًا باسم الحوسبة الاستدلالية، وهي تمنح النماذج وقت معالجة إضافيًا أثناء إكمال المهمة، مما يوفر مسارًا محتملاً للتغلب على قيود طرق التوسع التقليدية.
عندما سئل عما إذا كان أفضل من ChatGPT الخاص بـ OpenAI، فقد تهرب من السؤال كما هو موضح أدناه.
الغوص في DeepSeek
DeepSeek، الشركة التي تخطط لجعل نموذج DeepSeek-R1 الخاص بها مفتوح المصدر وإصدار واجهة برمجة التطبيقات، تعمل في مكانة مميزة في مجال الذكاء الاصطناعي.
بدعم من شركة High-Flyer Capital Management،الصينية باعتباره صندوق تحوط كمي يستفيد من الذكاء الاصطناعي لاتخاذ قرارات التداول، فإن نهج DeepSeek طموح واستراتيجي.
كان أحد ابتكاراتها المبكرة، وهو DeepSeek-V2 متعدد الأغراض، الذي يحلل كل من النصوص والصور، سببًا في دفع المنافسين الرئيسيين مثل ByteDance وBaidu وعلي بابا لتخفيض رسوم استخدام نموذجهم وحتى جعل بعض الخدمات مجانية بالكامل.
تشتهر شركة High-Flyer باستثماراتها الكبيرة في البنية التحتية للذكاء الاصطناعي، حيث تقوم ببناء مجموعات الخوادم الخاصة بها للتدريب النموذجي.
وتشير التقارير إلى أن الإصدار الأحدث يضم 10,000 وحدة معالجة رسومية من نوع Nvidia A100، بتكلفة تقترب من مليار ين (حوالي 138 مليون دولار).
أسس شركة High-Flyer Capital Management خريج علوم الكمبيوتر ليانغ وينفينغ، بهدف دفع حدود الذكاء الاصطناعي مع DeepSeek، واستهداف تطوير أنظمة "فائقة الذكاء" التي يمكن أن تعيد تعريف مستقبل الذكاء الاصطناعي.