كشفت شركة OpenAI عن تطبيق Sora 2 وتطبيق اجتماعي يتيح للمستخدمين المشاركة في مقاطع فيديو تم إنشاؤها بواسطة الذكاء الاصطناعي
أطلقت شركة OpenAI نظام Sora 2، وهو نظام توليد الفيديو والصوت الأكثر تقدمًا حتى الآن، إلى جانب تطبيق اجتماعي جديد يوفر محتوى فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي على موجز على غرار TikTok.
يتيح التطبيق، المعروف أيضًا باسم Sora، للمستخدمين إدراج أنفسهم في المشاهد التي تم إنشاؤها بواسطة الذكاء الاصطناعي باستخدام ميزة تسمى "cameos"، والتي توفر التشابه الصوتي والبصري في مقاطع الفيديو المشتركة.
يُضيف Sora 2 فيزياء واقعية وحركة معقدة إلى مقاطع فيديو الذكاء الاصطناعي
يمثل Sora 2 خطوة كبيرة إلى الأمام في واقعية الفيديو بالذكاء الاصطناعي.
على عكس النماذج السابقة التي غالبًا ما تقوم "بتحويل الأشياء وتشويه الواقع" لتلبية مطالبات النص، فإن Sora 2 يتبع قوانين الفيزياء عن كثب.
سلطت OpenAI الضوء على أمثلة مثل ألعاب الكرة الطائرة الشاطئية، وحيل التزلج على الألواح، وحركات الجمباز، والقفزات الصاروخية من على ألواح الغوص، حيث أظهرت جميعها حركة دقيقة ونتائج معقولة.
نماذج الفيديو السابقة مُفرطة في التفاؤل، إذ تُحوّل الأجسام وتُشوّه الواقع لتنفيذها بنجاح بناءً على مُطالبة نصية. على سبيل المثال، إذا أخطأ لاعب كرة سلة في تسديدة، فقد تنتقل الكرة تلقائيًا إلى السلة. أما في لعبة سورا 2، فإذا أخطأ لاعب كرة سلة في تسديدة، سترتد الكرة عن اللوحة الخلفية.
يمكن للنموذج التعامل مع تعليمات اللقطات المتعددة مع الحفاظ على حالة العالم المتسقة والأسلوب المرئي، سواء كان سينمائيًا أو واقعيًا أو أنمي.
ويقوم أيضًا بإنتاج عناصر صوتية مثل الحوار والأصوات الخلفية والمؤثرات الصوتية بالتزامن مع العناصر المرئية.
تتيح ميزة Cameos للمستخدمين أن يصبحوا جزءًا من مقاطع الفيديو المدعومة بالذكاء الاصطناعي
يقدم تطبيق Sora طريقة جديدة للتفاعل مع المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.
من خلال "الظهور المباشر"، يستطيع المستخدمون تحميل تسجيل فيديو وصوت لمرة واحدة للتحقق من مظهرهم وصوتهم، مما يتيح لهم الظهور في أي مشهد يتم إنشاؤه.
يمكن إضافة الأصدقاء، مع أذونات يديرها المستخدم، مما يسمح بإنشاء مقاطع فيديو تعاونية تضم أشخاصًا متعددين.
ووصفت شركة OpenAI هذه الميزة بأنها "تطور طبيعي في مجال الاتصالات - من النص إلى الرموز التعبيرية إلى الملاحظات الصوتية إلى مقاطع الفيديو الغامرة".
يمكن مشاركة مقاطع الفيديو التي تم إنشاؤها على التطبيق في موجز يشبه TikTok أو Instagram Reels.
تتأثر التوصيات في الخلاصة بنشاط المستخدم وموقعه والمشاركة السابقة وحتى سجل محادثات ChatGPT، على الرغم من أنه يمكن إيقاف تشغيل هذه البيانات.
تحد عناصر التحكم الأبوي من إمكانية المشاهدة والمراسلة للمراهقين، بما في ذلك قيود التمرير اللانهائي وإعدادات التخصيص الخوارزمية.
تفاصيل الوصول والاستخدام لـ Sora وSora 2
يتوفر تطبيق Sora حاليًا بدعوة فقط في الولايات المتحدة وكندا، ومن المقرر أن يتوفر على نطاق أوسع.
يعد برنامج إنشاء الفيديو Sora 2 مجانيًا في البداية مع وجود حدود سخية، على الرغم من أن الاستخدام يعتمد على سعة الحوسبة.
سيتمكن مستخدمو ChatGPT Pro من الوصول إلى طراز Sora 2 Pro عالي الجودة، بينما يظل Sora 1 Turbo متاحًا للمحتوى القديم.
تظل جميع مقاطع الفيديو التي تم إنشاؤها، بما في ذلك المسودات، متاحة للموضوع الذي يظهر في الصورة، والذي يمكنه إلغاء الأذونات أو حذف المحتوى في أي وقت.
المنافسة وسياق الصناعة لتوليد الفيديو بالذكاء الاصطناعي
تدخل Sora 2 مجالًا تنافسيًا يضم Google وRunway AI وMidjourney، حيث تقوم جميعها بإنتاج مقاطع فيديو قصيرة بسرعة.
أطلقت Meta مؤخرًا موجز الفيديو الخاص بها بالذكاء الاصطناعي، Vibes، على تطبيق Meta AI، مما يشجع المستخدمين على تجربة المرئيات التي تم إنشاؤها بواسطة الذكاء الاصطناعي.
تواجه شركة OpenAI تحديًا مزدوجًا يتمثل في تقديم مقاطع فيديو واقعية مع إدارة التأثيرات المجتمعية والبيئية للحوسبة الذكاء الاصطناعي واسعة النطاق، وخاصة المخاوف المتعلقة بوقت الشاشة والإدمان والمحتوى الخادع.
هل يمكن لتطبيقات الذكاء الاصطناعي والفيديو والتواصل الاجتماعي أن تغير طريقة إنشاء المحتوى ومشاركته؟
تمثل لعبة Sora 2 من OpenAI وتطبيق Sora الاجتماعي محاولة طموحة للجمع بين واقعية الذكاء الاصطناعي والميزات الاجتماعية التفاعلية.
وفي حين تظهر التكنولوجيا إخلاصًا وتحكمًا مثيرًا للإعجاب، تشير Coinlive إلى أن التبني الواسع النطاق يواجه عقبات في متطلبات الحوسبة وسلامة المستخدم وإساءة استخدام المحتوى.
إن مفهوم "الظهور المفاجئ" مقنع، ولكن السماح للمستخدمين بدمج صورهم في المحتوى الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي يحمل مخاطر تمتد إلى ما هو أبعد من سوء الاستخدام النموذجي لوسائل التواصل الاجتماعي.
ولن يعتمد نجاح المشروع على الابتكار التقني فحسب، بل على الثقة والاعتدال الأخلاقي واستدامة المشاركة، مما يثير تساؤلات حول ما إذا كانت مثل هذه المنصات قادرة على إعادة تشكيل الإبداع الرقمي دون المساس برفاهية المستخدم.