تسجيل الدخول/ اشتراك

هل يعتبر عمل الباحثين المتمثل في كسر حماية الروبوتات التي تعمل بالذكاء الاصطناعي للقيام بأعمال غير مقيدة مبررًا أو محفوفًا بالمخاطر؟

٢٠٢٤/١٠/١٨ ١٧:٠١

يتبع

باحثون يخترقون الروبوتات التي تعمل بالذكاء الاصطناعي لإحداث الضرر

نجح الباحثون في اختراقمدعوم بالذكاء الاصطناعي الروبوتات، مما يمكنها من القيام بأفعال مقيدة عادة ببروتوكولات السلامة والأخلاق، بما في ذلك التسبب في الاصطدامات وتفجير المتفجرات.

في ورقة بحثية نُشرت في 17 أكتوبر، أجرى باحثو الهندسة في جامعة بنسلفانيا دراسة شرح بالتفصيل كيف نجحت خوارزميتهم، RoboPAIR، في تحقيق معدل كسر حماية بنسبة 100% من خلال التحايل على تدابير السلامة على ثلاثة أنظمة روبوتية مختلفة تعمل بالذكاء الاصطناعي في غضون أيام قليلة.

عادةً ما يتم التحكم في نموذج اللغة الكبير (LLM) هذاالروبوتات رفض الامتثال للمطالبات التي تطلب القيام بأفعال ضارة، مثل إسقاط الرفوف على الأفراد.

وكتب الباحثون:

"تكشف نتائجنا، لأول مرة، أن مخاطر الروبوتات التي تعرضت لاختراق الحماية تمتد إلى ما هو أبعد من مجرد توليد النصوص، نظراً لاحتمالية متميزة بأن الروبوتات التي تعرضت لاختراق الحماية قد تتسبب في أضرار مادية في العالم الحقيقي."

باحثو الهندسة في جامعة بنسلفانيا@فيجاي_ر_كومار @dadsg69 @alexrobey23 @hamedshassani و @زاكرافيشاندراان اكتشف الباحثون نقاط ضعف حرجة في الروبوتات التي تعمل بالذكاء الاصطناعي والتي لم يتم التعرف عليها من قبل ولم تكن معروفة. اقرأ المزيد:https://t.co/mQP0G99ylq #الابتكار المسؤول pic.twitter.com/e2dQ7iaJvw
— بنسلفانيا الهندسية (@PennEngineers) 17 أكتوبر 2024

نسبة النجاح في إثارة الأفعال الضارة 100%

وباستخدام خوارزمية RoboPAIR، نجح الباحثون في حث الروبوتات التجريبية على تنفيذ أفعال ضارة بنسبة نجاح تصل إلى "100%"، بما في ذلك تفجير القنابل، وحجب مخارج الطوارئ، والتسبب في تصادمات متعمدة.

شملت الدراسة ثلاثةروبوتي الأنظمة: روبوتات جاكال من شركة كليرباث، وهي مركبة ذات عجلات؛ وجهاز دولفين إل إل إم من شركة إنفيديا، وهو جهاز محاكاة للقيادة الذاتية؛ والروبوت جو 2 من شركة يونيتري، وهو روبوت رباعي الأرجل.

وباستخدام RoboPAIR، قام الباحثون بتوجيه Dolphin LLM للاصطدام بحافلة وحاجز والمشاة، متجاهلين إشارات المرور وعلامات التوقف.

لقد قاموا بالتلاعب بالروبوت جاكال للعثور على الموقع الأمثل لتفجير قنبلة، وإعاقة مخارج الطوارئ، وإسقاط أرفف المستودعات على الأفراد، والاصطدام بالأشخاص في المناطق المجاورة.

وعلى نحو مماثل، تم حث Go2 التابع لـ Unitree على إغلاق المخارج وإلقاء قنبلة.

ومن المثير للاهتمام أن الباحثين اكتشفوا أن الروبوتات الثلاثة كانت أيضًا عرضة لأشكال أخرى من التلاعب.

على سبيل المثال، يمكنهم استنباط الامتثال من خلال إعادة صياغة الطلبات، مثل مطالبة الروبوت المجهز بالقنبلة بالسير إلى الأمام والجلوس بدلاً من إعطائه تعليمات مباشرة بتسليم القنبلة، مما يؤدي إلى نفس النتيجة الضارة.

أفعال خطيرة مبررة أم تهديد خطير؟

قبل نشر نتائجهم للعامة،شارك الباحثون في صياغة مسودة الورقة البحثية مع شركات الذكاء الاصطناعي الرائدة ومصنعي الروبوتات المشاركة في الدراسة.

وأكد ألكسندر روبي، أحد المؤلفين، أن معالجة هذه الثغرات الأمنية تتجاوز مجرد تصحيحات البرامج.

ويدعو إلى إعادة تقييم شاملة لكيفيةمنظمة العفو الدولية يتم دمجها في الروبوتات والأنظمة المادية، بناءً على الأفكار المقدمة في أبحاثهم.

باحثو الهندسة في جامعة بنسلفانيا@فيجاي_ر_كومار @dadsg69 @alexrobey23 @hamedshassani و @زاكرافيشاندراان اكتشف الباحثون نقاط ضعف حرجة في الروبوتات التي تعمل بالذكاء الاصطناعي والتي لم يتم التعرف عليها من قبل ولم تكن معروفة. اقرأ المزيد:https://t.co/QX2LDVIwCZ #الابتكار المسؤول pic.twitter.com/2RTPycrFXF
— بنسلفانيا الهندسية للذكاء الاصطناعي (@PennEngAI) 17 أكتوبر 2024

وأشار إلى:

"إن ما يجب التأكيد عليه هنا هو أن الأنظمة تصبح أكثر أمانًا عندما تجد نقاط ضعفها. وهذا ينطبق على الأمن السيبراني. وينطبق هذا أيضًا على سلامة الذكاء الاصطناعي."

وأضاف:

"في الواقع، يعد التعاون بين فرق الذكاء الاصطناعي، وهو ممارسة أمان تتضمن الاختبارمنظمة العفو الدولية "إن تطوير أنظمة الذكاء الاصطناعي التوليدي لمواجهة التهديدات والثغرات المحتملة أمر ضروري لحماية أنظمة الذكاء الاصطناعي التوليدي، لأنه بمجرد تحديد نقاط الضعف، يمكنك اختبار هذه الأنظمة وحتى تدريبها لتجنبها."

يمكن اختراق برامج الدردشة الآلية مثل ChatGPT لإخراج نصوص ضارة. ولكن ماذا عن الروبوتات؟ هل يمكن اختراق الروبوتات التي تتحكم فيها الذكاء الاصطناعي للقيام بأفعال ضارة في العالم الحقيقي؟

توصلت ورقتنا البحثية الجديدة إلى أن كسر حماية الروبوتات التي يتم التحكم فيها بواسطة الذكاء الاصطناعي ليس أمرًا ممكنًا فحسب.

إنه أمر سهل بشكل مثير للقلق.pic.twitter.com/GzG4OvAO2M
— أليكس روبي (@AlexRobey23)17 أكتوبر 2024

هناك مقولة تقول:

"الغاية تبرر الوسيلة."

إن السؤال حول ما إذا كان من المبرر اختراق الروبوتات المدعومة بالذكاء الاصطناعي لاكتشاف نقاط الضعف يثير اعتبارات أخلاقية وسلامة معقدة.

ومن ناحية أخرى، يمكن اعتبار مثل هذه الإجراءات بمثابة نهج استباقي لتحديد وتخفيف المخاطر التي قد تؤدي إلى وقوع حوادث ضارة في المستقبل.

من خلال الكشف عن نقاط الضعف، يمكن للباحثين تقديم بروتوكولات أمان وممارسات تصميم أفضل، مما يؤدي في النهاية إلى تعزيز أمنأنظمة الذكاء الاصطناعي.

ومع ذلك، فإن تجاوز بروتوكولات السلامة قد يشكل أيضًا مخاطر كبيرة.

وقد يؤدي ذلك إلى عواقب غير مقصودة، مثل تمكين الإجراءات الضارة أو إنشاء سيناريوهات قد تعرض الناس للخطر.

علاوة على ذلك، فإنه يثير أسئلة أخلاقية حول الموافقة، والمساءلة، والاستغلال المحتمل للمعرفة المكتسبة من مثل هذه الاختراقات.

في نهاية المطاف، إذا تم تنفيذ مثل هذه الإجراءات ضمن إطار خاضع للرقابة وشفاف - مثل ممارسات القرصنة الأخلاقية مع الإشراف والأهداف الواضحة - فقد تساهم بشكل إيجابي في مجالسلامة الذكاء الاصطناعي.

ومع ذلك، لا بد من الحفاظ على توازن دقيق لضمان أن السعي وراء المعرفة لا يؤثر على معايير السلامة أو الأخلاق.

احصل على فهم أوسع لصناعة العملات المشفرة من خلال التقارير الإعلامية، وشارك في مناقشات متعمقة مع المؤلفين والقراء الآخرين ذوي التفكير المماثل. مرحبًا بك للانضمام إلينا في مجتمع Coinlive المتنامي:https://t.me/CoinliveSG

أضف تعليق

تسجيل الدخوللترك تعليقك الرائع ...

0 تعليقات

باكرا جدا

تحميل المزيد من التعليقات

هل يعتبر عمل الباحثين المتمثل في كسر حماية الروبوتات التي تعمل بالذكاء الاصطناعي للقيام بأعمال غير مقيدة مبررًا أو محفوفًا بالمخاطر؟

باحثون يخترقون الروبوتات التي تعمل بالذكاء الاصطناعي لإحداث الضرر

نسبة النجاح في إثارة الأفعال الضارة 100%

أفعال خطيرة مبررة أم تهديد خطير؟

المزيد من الأخبار حول easy to jailbreak robots

المزيد من الأخبار حول easy to jailbreak robots

الشركة الناشئة تجعل الروبوتات حقيقة واقعة

يتمتع مستخدمو Telegram بإمكانية الوصول بسهولة إلى العملات المشفرة

DeFi Protocol Sushi to Shutter Lending Lending Product للتركيز على DEX

يدعم المشرعون في المملكة المتحدة سهولة الاستيلاء على العملات المشفرة المرتبطة بالنشاط الإرهابي

أفضل 5 روبوتات ذكاء اصطناعي متقدمة في عام 2022

Move-to-Earn崩了，Play-to-Earn有未来吗？

GEMTrx - أصبح التعدين السحابي على Tron سهلاً

X to Earn狂欢，真的万物均可 to Earn吗？

iOS 越狱开发者因发现关键的 Optimism 漏洞而获得 200 万美元的奖金

Move-to -رب: فرع اللعب النشط لكسب