اتجاه متزايد نحو الانسحاب من الخدمة بين الناشرين الرئيسيين
اختارت العديد من دور النشر ومنصات التواصل الاجتماعي البارزة استبعاد بياناتها من تدريب الذكاء الاصطناعي الخاص بشركة Apple.
ويأتي هذا التطور بعد أقل من ثلاثة أشهر من تقديم Apple لـ Applebot-Extended، وهي أداة مصممة لمنح أصحاب مواقع الويب القدرة على إلغاء استخدام بياناتهم لتدريب نماذج الذكاء الاصطناعي الخاصة بشركة Apple.
الكيانات البارزة مثل Facebook وInstagram وCraigslist وTumblr،صحيفة نيويورك تايمز وقد استفادت كل من صحيفة فاينانشال تايمز، ومجلة أتلانتيك، وفوكس ميديا، والشركة الأم لـWIRED، كوندي ناست، من هذا الخيار.
وكانت صحيفة نيويورك تايمز من أوائل الصحف التي قامت بمنع نشر هذا التقرير.
ويسلط هذا التفاعل الهام الضوء على الصراع المتزايد حول استخدام بيانات الويب في تدريب أنظمة الذكاء الاصطناعي، ويسلط الضوء على التحول في تصور أدوات البحث على الويب، والتي كانت تستخدم تقليديا لجمع المعلومات لمختلف خدمات الإنترنت.
تطور Applebot وظهور Applebot-Extended
تم إطلاق Applebot في الأصل في عام 2015، وتم تصميمه لتعزيز وظائف البحث الخاصة بشركة Apple، بما في ذلك Siri وSpotlight.
ومع ذلك، مع توسع مبادرات الذكاء الاصطناعي الخاصة بشركة Apple، توسع أيضًا هدف Applebot.
وبدأت البيانات التي تم جمعها في استخدامها لتدريب نماذج الذكاء الاصطناعي الأساسية لشركة Apple.
ولمعالجة المخاوف التي أبداها الناشرون ومنشئو المحتوى بشأن كيفية استخدام بياناتهم، قدمت شركة Apple برنامج Applebot-Extended.
يتيح هذا الامتداد الجديد لأصحاب مواقع الويب طلب عدم استخدام بياناتهم لأغراض تدريب الذكاء الاصطناعي.
على عكس Applebot الأصلي، الذي يواصل فحص مواقع الويب للحصول على وظائف البحث، يركز Applebot-Extended فقط على استخدام البيانات لمشاريع الذكاء الاصطناعي.
ردود أفعال الناشرين ورؤى البيانات
كان رد الفعل تجاه Applebot-Extended كبيرًا، حيث اختار العديد من الناشرين حظره.
تُظهِر بيانات من شركة Originality AI الناشئة في أونتاريو والمتخصصة في اكتشاف الذكاء الاصطناعي أنه اعتبارًا من الأسبوع الماضي، كان حوالي 7% من المواقع الإلكترونية ذات حركة المرور الكثيفة - وخاصة منافذ الأخبار والإعلام - تحظر Applebot-Extended.
وفي هذا الأسبوع، كشف تحليل أجراه موقع Dark Visitors أن حوالي 6% من المواقع الإلكترونية قامت بحظر الروبوت.
تشير هذه النسبة المنخفضة نسبيًا إلى أن العديد من مالكي مواقع الويب لا يدركون وجود تعارض حتى الآن أو يظلون غير مدركين لخيار استبعاد Applebot-Extended.
وجد بن ويلش، وهو صحفي متخصص في البيانات، أن ما يزيد قليلاً على ربع مواقع الأخبار التي شملها الاستطلاع كانت تحظر Applebot-Extended.
وهذا يقارن بنسبة 53 بالمائة من المواقع الإخبارية التي تحظرOpenAI وحوالي 43 بالمائة يحظرون روبوت Google-Extended المخصص للذكاء الاصطناعي.
ويشير ويلش إلى أن عدد المواقع التي تحظر Applebot-Extended "يتزايد تدريجيا"، مما يشير إلى زيادة الوعي والتحرك.
القرارات الاستراتيجية والشراكات
في كثير من الأحيان، تعكس القرارات التي يتخذها الناشرون الرئيسيون بمنع Applebot-Extended أو السماح به اعتبارات استراتيجية أوسع نطاقاً.
على سبيل المثال، قامت شركة كوندي ناست في السابق بحظرOpenAI محركات البحث على الويب الخاصة بـ ’s ولكنها قامت بإلغاء حظرها بعد الإعلان الأخير عن الشراكة.
وتشير هذه الخطوة إلى استراتيجية عمل يتم فيها التفاوض على الوصول إلى البيانات كجزء من الاتفاقيات التجارية.
وبالمثل، اختارت شركة Vox Media حظر Applebot-Extended وأدوات كشط الذكاء الاصطناعي الأخرى ما لم تكن هناك شراكة قائمة، مؤكدة على نيتها في حماية قيمة المحتوى المنشور لديها.
وعلى النقيض من ذلك، فإن صحيفة نيويورك تايمز، التيمنخرط حاليًا في دعوى قضائية ضد OpenAI بشأن قضايا حقوق النشر انتقد طبيعة إلغاء الاشتراك في Applebot-Extended.
وأشار تشارلي ستادتلاندر، مدير الاتصالات الخارجية في صحيفة نيويورك تايمز، إلى:
"كما يوضح القانون وشروط الخدمة الخاصة بصحيفة التايمز، فإن نسخ المحتوى الخاص بنا أو استخدامه لأغراض تجارية محظور دون الحصول على إذن كتابي مسبق منا."
يسلط هذا الموقف الضوء على النقاش الدائر حول كيفية تقاطع حقوق المحتوى وتدريب الذكاء الاصطناعي.
كيفية إلغاء الاشتراك في Applebot-Extended
بالنسبة لأصحاب مواقع الويب الذين يتطلعون إلى إلغاء الاشتراك في Applebot-Extended، فإن العملية واضحة ومباشرة.
أولاً، حدد موقع ملف robots.txt أو قم بإنشائه على موقع الويب الخاص بك.
لمنع Applebot، أضف الأسطر التالية:
وكيل المستخدم: Applebot
عدم السماح: /
لمنع Applebot-Extended على وجه التحديد، قم بتضمين:
وكيل المستخدم: Applebot-Extended
عدم السماح: /
وأخيرًا، احفظ الملف وقم بتحميله إلى الدليل الجذر لموقع الويب الخاص بك.
ومن خلال القيام بذلك، لن تستخدم Apple بيانات موقعك لتدريب نماذج الذكاء الاصطناعي الخاصة بها، رغم أن المحتوى الخاص بك سيظل متاحًا لوظائف البحث.
كما توضح شركة أبل:
"لا يقوم Applebot-Extended بفحص صفحات الويب. لا يزال من الممكن تضمين صفحات الويب التي لا تسمح بفحص Applebot-Extended في نتائج البحث. يتم استخدام Applebot-Extended فقط لتحديد كيفية استخدام البيانات التي يفحصها وكيل مستخدم Applebot."
يعكس هذا التعديل في المشهد الرقمي نقاشًا أوسع نطاقًا حول حقوق البيانات والدور المتطور للذكاء الاصطناعي في إنشاء المحتوى وتوزيعه.
ومن المرجح أن يحمل المستقبل المزيد من التطورات مع تعامل الناشرين وشركات التكنولوجيا ومطوري الذكاء الاصطناعي مع هذه القضايا المعقدة.