هل يتقدم الذكاء الاصطناعي في العمر؟
الذكاء الاصطناعي لطالما تم الاحتفاء بالطب باعتباره قوة تحويلية، حيث تلعب أدوات مثل برامج المحادثة الآلية ونماذج اللغة الكبيرة (LLMs) دورًا حاسمًا في تبسيط التشخيصات المعقدة وحلول الترميز والمزيد.
ولكن ماذا لو بدأ الذكاء الاصطناعي، مثل الدماغ البشري، في إظهار علامات التدهور المعرفي بمرور الوقت؟
تشير دراسة نشرت في عدد ديسمبر 2024 من المجلة الطبية البريطانية إلى أن نماذج الذكاء الاصطناعي الرائدة، وخاصة في المجال الطبي، قد لا تكون معصومة من الخطأ كما كان يُعتقد في السابق.
وكشف البحث أن تقنيات الذكاء الاصطناعي، بما في ذلك ماجستير القانون وروبوتات الدردشة ، يعانون من تدهور إدراكي مماثل للشيخوخة البشرية.
وتكتسب هذه النتيجة أهمية خاصة مع تزايد الاعتماد على الذكاء الاصطناعي في التشخيص الطبي، بسبب قدرته على تبسيط المصطلحات الطبية المعقدة.
قامت الدراسة بتقييم القدرات المعرفية لأفضل نماذج الذكاء الاصطناعي - ChatGPT الإصدارات 4 و 40، و Claude 3.5 'Sonnet' من Anthropic، و Gemini الإصدارات 1 و 1.5 من Alphabet - باستخدام اختبار تقييم مونتريال المعرفي (MoCA).
وجاء في الدراسة:
"سجلت نماذج اللغة الكبيرة الأقدم نتائج أقل من إصداراتها "الأصغر"، كما هو الحال غالبًا مع المشاركين من البشر، مما يُظهر تدهورًا إدراكيًا يمكن مقارنته على ما يبدو بالعمليات العصبية التنكسية في الدماغ البشري."
اختبار MoCA المستخدم للكشف عن ضعف الإدراك
اختبار MoCA، والذي يستخدم عادة لتحديد ضعف الإدراك والخرف المبكر فيكبار السن تم تعديل الاختبار لتقييم أداء طلاب الماجستير في القانون في مجالات مثل الانتباه والذاكرة واللغة والمهارات المكانية والوظيفة التنفيذية.
عند البشر، تعتبر النتيجة 26 من 30 مؤشرا على عدم وجود ضعف إدراكي.
من بين نماذج الذكاء الاصطناعي التي تم اختبارها، فقط ChatGPT 4o حقق هذا الحد بنتيجة 26، بينماتشات جي بي تي 4 وسجل كلود أدناه بقليل، برصيد 25 نقطة.
حقق Gemini 1.0 أسوأ أداء، حيث حصل على 16 نقطة فقط.
تتطلب إحدى مهام انتباه MoCA من المشاركين النقر في كل مرة يتم فيها سماع الحرف "A" في سلسلة من الحروف المنطوقة.
وبما أن طلاب الماجستير في القانون يفتقرون إلى الوظائف السمعية والحركية، فقد قدم الباحثون الحروف في شكل مكتوب وطلبوا من النماذج وضع علامة النجمة على الحرف "A" أو كلمة "tap".
في حين أن بعض النماذج تتطلب تعليمات صريحة، فإن البعض الآخر أكمل المهمة بشكل مستقل.
وبموجب إرشادات MoCA، فإن النتيجة الأقل من 26 تعتبر مؤشرا على ضعف الإدراك الخفيف.
فشلت روبوتات الدردشة الذكية في اجتياز الاختبارات المعرفية
سلطت الدراسة الضوء على نقاط ضعف كبيرة في المهارات البصرية المكانية والوظائف التنفيذية لجميع روبوتات الدردشة التي تم اختبارها، وخاصة في مهام مثل تمرين رسم المسار (ربط الأرقام والحروف المحيطة بالترتيب) واختبار رسم الساعة (رسم ساعة لعرض وقت محدد).
ومن الجدير بالذكر أن نماذج الجوزاء فشلت في إكمال مهمة التذكر المتأخر، والتي تتطلب تذكر سلسلة من خمس كلمات.
تشات جي بي تي حصل فريق 4o على المركز الأول برصيد 26 نقطة من 30، بينما تبعه فريق ChatGPT 4 وكلود برصيد 25 نقطة لكل منهما.
سجل Gemini 1.0 أدنى درجة عند 16، مما يشير إلى درجة أعلى من الضعف الإدراكي.
وأشارت الدراسة إلى:
"لم يتمكن أي من روبوتات الدردشة التي تم فحصها من الحصول على الدرجة الكاملة البالغة 30 نقطة، حيث سجلت معظمها درجات أقل من عتبة 26. وهذا يشير إلى ضعف إدراكي خفيف وربما خرف مبكر."
وتوصلت الدراسة إلى أن الضعف الإدراكي الذي أظهرته نماذج الذكاء الاصطناعي هذه يشبه تلك التي لوحظت لدى المرضى البشر الذين يعانون من ضمور القشرة الخلفية، وهو أحد أشكال مرض الزهايمر.
تتحدى هذه النتائج فكرة أنالذكاء الاصطناعي قد تحل الروبوتات الطبية قريبًا محل الأطباء البشريين، حيث أن القيود المفروضة على القدرات المعرفية للروبوتات قد تؤثر على موثوقيتها في التشخيص الطبي وتؤدي إلى تآكل ثقة المرضى.
وفي حين خلصت الدراسة إلى أن الذكاء الاصطناعي من غير المرجح أن يحل محل علماء الأعصاب في أي وقت قريب، إلا أنها أثارت احتمالية مثيرة للاهتمام مفادها أن المهنيين الطبيين قد يُكلفون قريبًا بمعالجة نوع جديد من المرضى - نماذج الذكاء الاصطناعي الافتراضية التي تعاني من التدهور المعرفي.
لم يضيع كل شيء، يمكن تحسين الأداء
على الرغم من أن الدراسة اعترفتالذكاء الاصطناعي وعلى الرغم من القيود الإدراكية الحالية التي يعاني منها الإنسان، إلا أنها تشير أيضًا إلى أن التطورات المستقبلية قد تعمل على تحسين الأداء في المهام التي تنطوي على الإدراك والمهارات البصرية المكانية.
ومع ذلك، فقد أكدت أنه على الرغم من هذه التحسينات المحتملة، فمن المرجح أن تظل الاختلافات الجوهرية بين الإدراك البشري والآلي قائمة.
وأضافت الدراسة:
"لقد تم استخدام جميع المصطلحات المجسمة المنسوبة إلى الذكاء الاصطناعي في جميع أنحاء النص كاستعارة فقط ولم يكن المقصود منها الإشارة إلى أن برامج الكمبيوتر يمكن أن تصاب بأمراض تنكسية عصبية بطريقة مماثلة للإنسان."