الذكاء الاصطناعي يتعامل مع المهام الواقعية باستخدام مشغل OpenAI
تخيل أنك تطلب من الذكاء الاصطناعي التعامل مع مهماتك عبر الإنترنت - من حجز الرحلات الجوية إلى طلب البقالة - ومشاهدته وهو يؤدي هذه المهام بدقة.
تعد الميزة الجديدة من OpenAI، Operator، بهذا بالضبط.
من خلال التحكم في متصفح افتراضي، يهدف المشغل إلى تبسيط المهام الرقمية من خلال إجراءات في الوقت الفعلي.
ومع ذلك، فإن سعرها الباهظ وحصريتها أثارت نقاشات حول إمكانية الوصول إليها والعدالة.
تم الإعلان عن هذه الإضافة الأخيرة هذا الصباح، وهي متاحة حصريًا لمشتركي Pro في الولايات المتحدة، بتكلفة 200 دولار شهريًا.
يمثل هذا الإطلاق الخطوة الأولى لشركة OpenAI في تصفح الويب بشكل مستقل، مما يوفر للمستخدمين طريقة مبتكرة لإدارة الأنشطة اليومية عبر الإنترنت.
كيف يعمل المشغل خلف الكواليس
على عكس الأدوات السابقة التي تعتمد على واجهات برمجة التطبيقات، يستخدم Operator متصفحًا قائمًا على السحابة يحاكي الإجراءات البشرية.
يقوم بالتنقل عبر مواقع الويب عن طريق النقر على الأزرار وملء النماذج وتفسير تخطيطات مواقع الويب.
يتم توثيق كل إجراء من خلال لقطة شاشة، لإبقاء المستخدمين على اطلاع بالتقدم المحرز.
على سبيل المثال، عند حجز تذاكر حدث ما، يبحث المشغل عن الخيارات ويختار أفضل الصفقات ويطلب تأكيد المستخدم قبل الانتهاء من الدفع.
في السيناريوهات التي تظهر فيها مشكلات، يمكن للمستخدمين التدخل يدويًا باستخدام خيار "التحكم".
يعتمد جوهر وظيفة المشغل على نموذج ذكاء اصطناعي جديد، وهو وكيل مستخدم الكمبيوتر (CUA).
يتيح هذا النموذج للنظام التعامل مع التغييرات غير المتوقعة في موقع الويب والنوافذ المنبثقة ورسائل الخطأ مع الحد الأدنى من الانقطاعات.
تتميز Operator بهذه القدرة على التكيف، مما يسمح لها بالعمل حتى على المنصات غير المدعومة.
القدرات الواقعية مع الملاحظات المرئية
يمكن للمشغل التعامل مع مهام متنوعة، مثل تفسير قوائم التسوق المكتوبة بخط اليد باستخدام GPT-Vision وطلب البقالة من متجر مفضل.
تضمن الشراكات المعدّة مسبقًا مع منصات مثل Uber وDoorDash تنقلًا أكثر سلاسة لحجوزات الرحلات أو توصيل الطعام.
بالنسبة لمواقع الويب غير المدعومة صراحةً، لا يزال المشغل يحاول تنفيذ المهام عبر إمكانيات التحكم في المتصفح.
تمنحها هذه المرونة أفضلية على المنافسين، مما يجعلها حلاً متعدد الاستخدامات للمهام اليومية عبر الإنترنت.
معايير مثيرة للإعجاب تتفوق على المنافسين
في الاختبارات، أظهر المشغل أداءً متفوقًا مقارنة بالأدوات المماثلة.
حققت نسبة كفاءة 38.1% على OSWorld، وهو معيار للتعامل مع أنظمة التشغيل القياسية، متجاوزة بذلك أقرب منافس بنسبة 22%.
وفي موقع WebArena، الذي يقوم بتقييم تصفح التجارة الإلكترونية، حصل Operator على نسبة 58.1%، متفوقًا على المنافسين بنسبة 36.2%.
سلطت OpenAI الضوء على هذه النتائج لإظهار فعالية المشغل وموثوقيته في التطبيقات الواقعية.
ومع ذلك، فإنهم يحذرون من أن الميزة لا تزال في مرحلة المعاينة البحثية، ومن المتوقع حدوث أخطاء أو ثغرات في بعض الأحيان.
حصرية ومكلفة في الوقت الحالي
حاليًا، يقتصر المشغل على المستخدمين المحترفين، مما يخلق حاجزًا ماليًا واضحًا.
وقد أثار هذا الحصر المخاوف بشأن ظهور نظام متعدد المستويات، حيث يمكن فقط للمستخدمين الأثرياء الوصول إلى أفضل قدرات الذكاء الاصطناعي.
تخطط OpenAI لتوسيع نطاق طرحها للمشتركين في Plus قريبًا، مع المزيد من التوافر من خلال واجهة برمجة التطبيقات الخاصة بها، مما قد يؤدي إلى ظهور أدوات أتمتة جديدة للمطورين.
مخاوف الخصوصية وقضايا الثقة
أحد الجوانب السلبية الملحوظة هو اعتماد المشغل على بيانات اعتماد المستخدم لإكمال المهام.
وبما أن البرنامج يعمل من خلال متصفح سحابي، فيجب على المستخدمين تسجيل الدخول عن بُعد، مما يضع ثقة كبيرة في ضمانات OpenAI بعدم تخزين البيانات الحساسة.
بالنسبة للأفراد المهتمين بالخصوصية، فإن هذا الاعتماد على خوادم OpenAI قد يكون بمثابة عامل حاسم.
كيف يتعامل المشغل مع المخاطر
هل يستحق تحديث مشغل OpenAI سعر 200 دولار؟
إلى جانب التحكم الجديد في تصفح الويب، تعمل OpenAI على توسيع نطاق وكلاء الذكاء الاصطناعي لديها لتعزيز قدرات مساعدها الحالي بشكل أكبر.
تم تعيين هذه العناصر الإضافية لتكملة المشغل، ولكن لم يتم الكشف عن الوظائف المحددة بعد.
في الوقت الحالي، يمثل Operator خطوة مهمة إلى الأمام في مجال الأتمتة المعتمدة على الذكاء الاصطناعي، مما يعمل على تبسيط المهام اليومية مثل حجز الرحلات الجوية وطلب الطعام.
ومع ذلك، هل يستحق هذا الترقية الجديدة حقًا الرسوم الشهرية الباهظة البالغة 200 دولار؟
على الرغم من أن المشغل يوفر الراحة، إلا أنه يزيل أيضًا تجربة إدارة هذه المهام يدويًا، ولا يزال يتطلب الإشراف لضمان سير كل شيء بسلاسة.
وقد يؤدي هذا الاعتماد على الإشراف البشري إلى جعل النظام أقل جاذبية لأولئك الذين يسعون إلى حل مستقل تمامًا.
وبينما تواصل OpenAI استكشاف طرق جديدة لتوسيع عروضها، تظل قيمة هذا التحديث موضع جدل.