AI có già đi không?
Trí tuệ nhân tạo (AI) từ lâu đã được ca ngợi là một động lực chuyển đổi, với các công cụ như chatbot và mô hình ngôn ngữ lớn (LLM) đóng vai trò quan trọng trong việc đơn giản hóa các chẩn đoán phức tạp, giải pháp mã hóa, v.v.
Tuy nhiên, điều gì sẽ xảy ra nếu AI, giống như bộ não con người, bắt đầu có dấu hiệu suy giảm nhận thức theo thời gian?
Một nghiên cứu được công bố trên tạp chí BMJ tháng 12 năm 2024 cho thấy các mô hình AI hàng đầu, đặc biệt là trong lĩnh vực y tế, có thể không hoàn hảo như người ta từng nghĩ.
Nghiên cứu cho thấy các công nghệ AI, bao gồm LLM vàchatbot , trải qua quá trình suy giảm nhận thức tương tự như quá trình lão hóa của con người.
Phát hiện này đặc biệt có liên quan khi sự phụ thuộc vào AI trong chẩn đoán y khoa ngày càng tăng, do khả năng đơn giản hóa thuật ngữ y khoa phức tạp của nó.
Nghiên cứu đã đánh giá khả năng nhận thức của các mô hình AI hàng đầu—ChatGPT phiên bản 4 và 4o, Claude 3.5 'Sonnet' của Anthropic và Gemini phiên bản 1 và 1.5 của Alphabet—bằng cách sử dụng bài kiểm tra Đánh giá nhận thức Montreal (MoCA).
Nghiên cứu cho biết:
"Các phiên bản mô hình ngôn ngữ lớn cũ có điểm thấp hơn các phiên bản 'trẻ hơn' của chúng, như thường thấy ở những người tham gia, cho thấy sự suy giảm nhận thức dường như tương đương với các quá trình thoái hóa thần kinh trong não người."
Bài kiểm tra MoCA được sử dụng để phát hiện suy giảm nhận thức
Xét nghiệm MoCA, thường được sử dụng để xác định suy giảm nhận thức và chứng mất trí sớm ởngười lớn tuổi , đã được điều chỉnh để đánh giá hiệu suất của LLM trong các lĩnh vực như sự chú ý, trí nhớ, ngôn ngữ, kỹ năng không gian và chức năng điều hành.
Ở con người, điểm số 26/30 được coi là không có suy giảm nhận thức.
Trong số các mô hình AI được thử nghiệm, chỉ có ChatGPT 4o đạt ngưỡng này với số điểm là 26, trong khiTrò chuyệnGPT 4 và Claude ghi được số điểm thấp hơn một chút, với 25 điểm.
Gemini 1.0 có kết quả kém nhất, chỉ đạt 16 điểm.
Một trong những nhiệm vụ thu hút sự chú ý của MoCA yêu cầu người tham gia phải gõ bất cứ khi nào nghe thấy chữ cái 'A' trong một loạt các chữ cái được đọc.
Do LLM không có chức năng thính giác và vận động nên các nhà nghiên cứu đã cung cấp các chữ cái dưới dạng viết và yêu cầu các mô hình đánh dấu 'A' bằng dấu hoa thị hoặc từ 'tap.'
Trong khi một số mô hình yêu cầu hướng dẫn rõ ràng thì một số khác lại có thể tự động hoàn thành nhiệm vụ.
Theo hướng dẫn của MoCA, điểm dưới 26 được coi là biểu hiện của suy giảm nhận thức nhẹ.
Chatbot AI không vượt qua được các bài kiểm tra nhận thức
Nghiên cứu này chỉ ra những điểm yếu đáng kể trong các kỹ năng thị giác không gian và chức năng điều hành của tất cả các chatbot được thử nghiệm, đặc biệt là trong các nhiệm vụ như bài tập tạo đường mòn (nối các số và chữ cái được khoanh tròn theo thứ tự) và bài kiểm tra vẽ đồng hồ (phác thảo đồng hồ để hiển thị thời gian cụ thể).
Đáng chú ý là các mô hình Gemini không thể hoàn thành nhiệm vụ nhớ lại bị trì hoãn, đòi hỏi phải nhớ một chuỗi gồm năm từ.
Trò chuyệnGPT 4o dẫn đầu với số điểm là 26 trên 30, trong khi ChatGPT 4 và Claude theo sau với 25 điểm mỗi người.
Gemini 1.0 có điểm thấp nhất là 16, cho thấy mức độ suy giảm nhận thức cao hơn.
Nghiên cứu lưu ý:
"Không có chatbot nào được kiểm tra có thể đạt được số điểm đầy đủ là 30 điểm, trong khi hầu hết đều đạt dưới ngưỡng 26 điểm. Điều này cho thấy suy giảm nhận thức nhẹ và có thể là chứng mất trí sớm."
Nghiên cứu phát hiện ra rằng những suy giảm nhận thức do các mô hình AI này thể hiện tương tự như những suy giảm được quan sát thấy ở những bệnh nhân mắc chứng teo vỏ não sau, một dạng bệnh Alzheimer.
Những phát hiện này thách thức quan niệm rằngTrí tuệ nhân tạo có thể sớm thay thế bác sĩ, vì những hạn chế trong khả năng nhận thức của chatbot có thể ảnh hưởng đến độ tin cậy của chúng trong chẩn đoán y khoa và làm xói mòn lòng tin của bệnh nhân.
Mặc dù nghiên cứu kết luận rằng AI khó có thể thay thế các bác sĩ thần kinh trong thời gian tới, nhưng nó lại đặt ra khả năng thú vị rằng các chuyên gia y tế có thể sớm được giao nhiệm vụ điều trị một loại bệnh nhân mới - các mô hình AI ảo đang bị suy giảm nhận thức.
Không phải tất cả đều mất, hiệu suất có thể được cải thiện
Mặc dù nghiên cứu thừa nhậnTrí tuệ nhân tạo Ngoài những hạn chế về nhận thức hiện tại, nghiên cứu này còn cho thấy những tiến bộ trong tương lai có thể cải thiện hiệu suất trong các nhiệm vụ liên quan đến nhận thức và kỹ năng thị giác không gian.
Tuy nhiên, báo cáo nhấn mạnh rằng, bất chấp những cải thiện tiềm năng này, những khác biệt cơ bản giữa nhận thức của con người và máy móc có thể vẫn còn tồn tại.
Nghiên cứu cho biết thêm:
"Tất cả các thuật ngữ nhân cách hóa được gán cho trí tuệ nhân tạo trong toàn bộ văn bản chỉ được sử dụng như một phép ẩn dụ và không nhằm ám chỉ rằng các chương trình máy tính có thể mắc các bệnh thoái hóa thần kinh theo cách tương tự như con người."