يجب على OpenAI تسليم 20 مليون سجل ChatGPT في معركة حقوق النشر عالية المخاطر مع منافذ الأخبار
تواجه OpenAI اختبارًا قانونيًا كبيرًا حيث أمر قاضي فيدرالي في مانهاتن الشركة بتسليم 20 مليون سجل محادثة ChatGPT مجهول المصدر إلى صحيفة نيويورك تايمز وشيكاغو تريبيون ومؤسسات إعلامية أخرى.
تعتبر الدردشات، المأخوذة من تفاعلات المستخدمين مع الذكاء الاصطناعي، دليلاً رئيسيًا في دعوى قضائية تزعم أن نماذج لغة OpenAI أعادت إنتاج محتوى إخباري محمي بحقوق الطبع والنشر دون إذن.
رفض القاضي اعتراضات الخصوصية وأمر ببيانات مجهولة المصدر
الولايات المتحدة. حكمت قاضية الصلح أونا وانج ضد اعتراضات OpenAI المتعلقة بالخصوصية، مشيرة إلى أنه يجب على الشركة إزالة الأسماء وعناوين البريد الإلكتروني وأرقام الهواتف وغيرها من المعلومات التعريفية قبل تسليم السجلات.
صرح وانغ،
"هناك طبقات متعددة من الحماية في هذه الحالة على وجه التحديد بسبب الطبيعة الحساسة للغاية والخاصة لكثير من الاكتشاف."
بمجرد اكتمال إخفاء الهوية، يكون لدى OpenAI سبعة أيام لتقديم السجلات.
أعربت OpenAI عن قلقها بشأن السابقة التي قد يفرضها هذا الحكم، مسلطًا الضوء على أن الغالبية العظمى من محادثات المستخدمين - والتي تقدر بعشرات المليارات - لا علاقة لها بمطالبات حقوق النشر. حذر دان ستاكي، كبير مسؤولي أمن المعلومات في شركة OpenAI، من أن مثل هذه المطالبات "تتجاهل حماية الخصوصية طويلة الأمد" وقد تقوض ثقة المستخدم. تزعم وسائل الإعلام وجود أدلة على إساءة استخدام المحتوى تزعم صحيفة نيويورك تايمز والصحف المملوكة لمجموعة MediaNews Group أن السجلات ستكشف ما إذا كان ChatGPT قد أنشأ فقرات تعكس مقالاتهم عن كثب. انتقد فرانك باين، المحرر التنفيذي لمجموعة MediaNews Group، مقاومة OpenAI: "كانت قيادة OpenAI تهلوس عندما اعتقدوا أنهم يستطيعون الإفلات من حجب الأدلة حول كيفية اعتماد نموذج أعمالهم على السرقة من الصحفيين المجتهدين". يؤكد المدعون أن القضية ليست المقصود هو منع تطوير الذكاء الاصطناعي ولكن لضمان العدالة والتعويض عن العمل الصحفي.
كما يشيرون إلى أن الذكاء الاصطناعي يمكن أن ينتج محتوى محميًا بحقوق الطبع والنشر دون أي مطالبة من المستخدم، مؤكدين على الحاجة إلى التدقيق في مخرجات النموذج.
نطاق الدعوى القضائية والآثار الأوسع
الدعوى القضائية، التي تم رفعها لأول مرة في عام 2023، هي جزء من موجة من مطالبات حقوق الطبع والنشر التي تستهدف شركات التكنولوجيا بما في ذلك Microsoft وMeta وGoogle.
يزعم المدعون أن مطوري الذكاء الاصطناعي استخدموا مواد محمية بحقوق الطبع والنشر دون إذن لتدريب نماذجهم، مما أدى إلى مخرجات تكرر أو تلخص المحتوى المحمي بجدار الدفع.
سلطت القاضية وانج الضوء على تناسب 20 مليون سجل، مشيرة إلى أنها تمثل أقل من 0.05٪ من جميع سجلات ChatGPT التي تحتفظ بها OpenAI.
وأكدت أن الدردشات ذات صلة بكل من مطالبات إعادة إنتاج المحتوى و دفاع OpenAI فيما يتعلق بنشاط المستخدم الآخر.
يشير الخبراء القانونيون إلى أن الحكم يشير إلى استعداد المحاكم لمحاسبة شركات الذكاء الاصطناعي مع موازنة خصوصية المستخدم.
يثير القرار أيضًا أسئلة أوسع نطاقًا حول شفافية عمليات تدريب الذكاء الاصطناعي وحقوق الملكية الفكرية والحاجة المحتملة إلى ترتيبات الترخيص بين الناشرين ومطوري الذكاء الاصطناعي.
هل يمكن أن تستمر مخاوف الخصوصية على الرغم من إخفاء الهوية
في حين أكد وانغ وجود ضمانات للخصوصية، يحذر الخبراء من إمكانية هندسة البيانات المجهولة الهوية عكسيًا للكشف عن معلومات حساسة.
صرحت OpenAI وشركات الذكاء الاصطناعي الأخرى بأن بيانات المستخدم لا تُخزن بشكل دائم، لكن هذه الحالة تُبرز التوتر بين سرية المستخدم ومساءلة الشركات.
قد يُعيد تأثير الصناعة تشكيل ممارسات بيانات الذكاء الاصطناعي
بالنسبة للناشرين، تُمثل هذه القضية فرصة لتأمين الاعتراف - وربما التعويض - لاستخدام محتواهم.
تخضع شركات منافسة مثل مايكروسوفت وميتا لتدقيق مماثل، وقد تصبح صفقات الترخيص معيارًا جديدًا لشركات الذكاء الاصطناعي التي تعتمد على الصحافة مادة.
وفي الوقت نفسه، قد يستكشف مطورو الذكاء الاصطناعي تقنيات إخفاء الهوية المتقدمة أو نماذج أصغر نطاقًا للحد من مخاطر الانتهاك.
الحكم يتحدى دور الذكاء الاصطناعي في حقوق الوسائط والبيانات
ترى Coinlive أن هذا الحكم يمثل نقطة تحول لصناعة الذكاء الاصطناعي.
يجبر القرار شركات الذكاء الاصطناعي على مواجهة كيفية جمعها وتخزينها واستخدام المحتوى أثناء التعامل مع مخاوف خصوصية المستخدم. كما يثير تساؤلات حول استدامة نماذج الذكاء الاصطناعي المبنية على بيانات غير مصرح بها وما إذا كانت الابتكارات المستقبلية ستتطلب أطرًا أخلاقية وقانونية أكثر وضوحًا. أصبح التوازن بين الشفافية والملكية الفكرية وثقة المستخدم الآن تحت تدقيق غير مسبوق، ويمكن أن تحدد كيفية استجابة شركات الذكاء الاصطناعي الفصل التالي من وسائل الإعلام الرقمية وتنظيم الذكاء الاصطناعي.