أنثروبيك تكشف عن سونيت Claude 3.5 وهايكو: قفزة في قدرات الذكاء الاصطناعي
أطلقت شركة Anthropic أحدث نماذج الذكاء الاصطناعي الخاصة بها، Claude 3.5 Sonnet و Claude 3.5 Haiku، والتي تتميز بتحسينات كبيرة مقارنة بالإصدارات السابقة.
لقد أصبح طراز Claude 3.5 Sonnet، الذي تم تحديثه بعد أربعة أشهر فقط من الإصدار الأولي، يتفوق الآن بشكل أكبر في قدرات الترميز، وهو المجال الذي كان يُنظر إليه بالفعل على أنه رائد فيه.
وفي الوقت نفسه، يعد Claude 3.5 Haiku بتقديم أداء يضاهي الطراز السابق الأكثر تقدمًا، Claude 3 Opus، مع الحفاظ على فعاليته من حيث التكلفة والكفاءة.
ما الجديد في Claude 3.5 Sonnet؟
يقدم طراز Claude 3.5 Sonnet ميزة مبتكرة: استخدام الكمبيوتر.
يتيح هذا للنموذج أداء المهام المخصصة عادةً للمشغلين البشريين من خلال التفاعل مع بيئات سطح المكتب.
من خلال الاستفادة من قدرته على تصفح الويب، أصبح بإمكان Claude 3.5 Sonnet الآن تنفيذ الأوامر على مستوى سطح المكتب.
وهذا يعني أنه يمكنه التعامل مع تطبيقات البرمجيات واستخدام مواقع الويب بنفس الطريقة التي يفعلها الإنسان.
وفقا لـ Anthropic،
"تشير ملاحظات العملاء المبكرة إلى أن Claude 3.5 Sonnet المحدث يمثل قفزة كبيرة في مجال الترميز المدعوم بالذكاء الاصطناعي."
في حين أن الفوائد واضحة، إلا أن المخاوف بشأن استقلالية الذكاء الاصطناعي لا تزال قائمة.
تؤكد شركة Anthropic للمستخدمين أنهم سيظلون تحت السيطرة.
من خلال مطالبات محددة، يمكن للمستخدمين توجيه تصرفات كلود، والتي تترجم إلى أوامر كمبيوترية لتنفيذ المهام.
ومن الجدير بالذكر أن أداء كلود على معايير الصناعة شهد تحسينات كبيرة، حيث حصل على 49% على لوحة المتصدرين SWE-bench Verified، ارتفاعًا من 33.4%.
وتضع هذه النتيجة Claude 3.5 Sonnet في وضع متقدم على النماذج الأخرى المتاحة، بما في ذلك أحدث عروض OpenAI.
كيف تتم مقارنة Claude 3.5 Haiku؟
ومن المقرر إطلاق طراز Claude 3.5 Haiku القادم قريبًا ويهدف إلى مطابقة قدرات سابقه، Claude 3 Opus، مع الحفاظ على نفس السرعة والتكلفة مثل Haiku الأصلي.
يتميز هذا النموذج بانخفاض زمن الوصول والقدرة المعززة على متابعة التعليمات.
وتصفه Anthropic بأنه مناسب بشكل خاص للمنتجات والمهام التي يواجهها المستخدم والتي تتطلب تفاعلات سريعة مع مجموعات بيانات ضخمة، مثل تحليل تاريخ الشراء أو سجلات المخزون.
بفضل أدائها المتفوق، تم تصميم Claude 3.5 Haiku ليكون فعالاً للغاية، ويتميز بالتحسينات في كل مجموعة من المهارات مقارنة بالإصدار السابق.
على سبيل المثال، حققت نتيجة 40.6% على لوحة صدارة SWE-bench Verified، متجاوزة العديد من النماذج المتاحة للجمهور، بما في ذلك Claude 3.5 Sonnet الأصلي.
ماذا يعني استخدام الكمبيوتر بالنسبة للمطورين؟
تشكل ميزة استخدام الكمبيوتر لحظة محورية للتفاعل مع الذكاء الاصطناعي.
يمكن الآن لبرنامج Claude 3.5 Sonnet "رؤية" واجهات الكمبيوتر من خلال لقطات الشاشة، مما يتيح له التنقل والتفاعل مع واجهات المستخدم بشكل مباشر.
يمكن للمطورين توجيه Claude لأتمتة المهام المتكررة، مما يسمح بسير عمل أكثر كفاءة.
"لقد فوجئنا بالسرعة التي تمكن بها كلود من التعميم من خلال التدريب على استخدام الكمبيوتر الذي قدمناه له"، كما قال أنثروبيك، مسلطًا الضوء على قدرة النموذج على تحويل تعليمات المستخدم إلى سلسلة من الإجراءات المنطقية.
ورغم هذه التطورات، تعترف منظمة أنثروبيك بأن التكنولوجيا لا تزال تجريبية وغير كاملة.
يتعين على المستخدمين توخي الحذر، حيث قد يواجه Claude صعوبة في أداء المهام الأساسية مثل التمرير والتكبير.
وتوضح الأدلة القصصية من فريق التطوير غرائب النموذج؛ على سبيل المثال، تم النقر مرة واحدة لإيقاف تسجيل شاشة طويل، مما أدى إلى فقدان اللقطات.
تدابير السلامة والاعتبارات الأخلاقية
ويثير تقديم مثل هذه القدرات القوية أيضًا تساؤلات حول إساءة الاستخدام المحتملة.
قامت شركة Anthropic بتطوير تصنيفات وضمانات جديدة للكشف عن الاستخدام الضار لميزة استخدام الكمبيوتر.
وتظل الشركة يقظة بشأن الآثار الأخلاقية لتكنولوجيتها، مشيرة إلى أنه من المحتمل استغلالها في إرسال رسائل البريد العشوائي أو المعلومات المضللة أو الأنشطة الاحتيالية.
مع توفر Claude 3.5 Sonnet للمستخدمين، فإن الترقب المحيط بإطلاق Claude 3.5 Haiku يضيف إلى الإثارة حول ما يمكن أن تعنيه هذه التطورات للترميز المدعوم بالذكاء الاصطناعي والإنتاجية العامة.