인공지능은 나이를 먹을까요?
인공 지능(AI) 는 챗봇 및 대규모 언어 모델(LLM)과 같은 도구가 복잡한 진단, 코딩 솔루션 등을 간소화하는 데 중요한 역할을 하면서 오랫동안 혁신의 원동력으로 인정받아 왔습니다.
하지만 AI도 인간의 뇌와 마찬가지로 시간이 지남에 따라 인지 능력이 저하되기 시작한다면 어떻게 될까요?
2024년 12월호에 발표된 한 연구에 따르면 특히 의료 분야에서 선도적인 AI 모델이 생각만큼 완벽하지 않을 수 있다고 합니다.
이 연구에 따르면 LLM을 포함한 AI 기술과챗봇 는 인간의 노화와 유사한 인지 기능 저하를 경험합니다.
이 발견은 복잡한 의학 용어를 단순화하는 AI의 능력으로 인해 의료 진단에 대한 의존도가 높아짐에 따라 특히 중요한 의미를 갖습니다.
이 연구는 몬트리올 인지 평가(MoCA) 테스트를 사용하여 최고의 AI 모델인 ChatGPT 버전 4와 4o, Anthropic의 Claude 3.5와 소네트, Alphabet의 Gemini 버전 1과 1.5의 인지 능력을 평가했습니다.
연구팀은 이렇게 말했습니다:
오래된 대형 언어 모델 버전은 인간 참가자의 경우와 마찬가지로 '젊은' 버전보다 낮은 점수를 받았으며, 이는 인간 뇌의 신경 퇴행 과정과 비슷한 인지 기능 저하를 보였습니다."라고 설명합니다;
인지 장애를 감지하는 데 사용되는 MoCA 테스트
MoCA 테스트는 일반적으로 다음과 같은 인지 장애 및 초기 치매를 식별하는 데 사용됩니다.고령자 는 주의력, 기억력, 언어, 공간 능력, 실행 기능 등의 영역에서 LLM의 수행 능력을 평가하기 위해 개발되었습니다.
인간 피험자의 경우 30점 만점에 26점은 인지 장애가 없는 것으로 간주됩니다.
테스트한 AI 모델 중 ChatGPT 4o만이 26점으로 이 임계값을 충족했습니다.ChatGPT 4, 클로드는 25점으로 그 바로 아래 점수를 기록했습니다.
제미니 1.0은 16점에 불과해 가장 저조한 성적을 기록했습니다.
MoCA 주의 과제 중 하나는 참가자가 일련의 음성 문자에서 'A'라는 글자가 들릴 때마다 탭해야 하는 것입니다.
연구진은 LLM이 청각과 운동 기능이 부족하다는 점을 고려하여 글자를 서면으로 제공하고 모델에게 별표 또는 '탭'이라는 단어로 'A'를 표시하도록 요청했습니다;
일부 모델은 명시적인 지시가 필요했지만, 다른 모델은 자율적으로 작업을 완료했습니다.
MoCA 가이드라인에 따라 26점 미만은 경도 인지 장애를 나타내는 것으로 간주됩니다.
인지 테스트 통과에 실패한 AI 챗봇
이 연구는 모든 테스트 챗봇의 시각 공간 기술과 실행 기능에서 상당한 약점을 발견했으며, 특히 트레일 만들기(둘러싸인 숫자와 문자를 순서대로 연결하기) 및 시계 그리기(특정 시간을 표시하기 위해 시계를 스케치하기) 같은 작업에서 두드러졌습니다.
특히 쌍둥이자리 모델은 다섯 단어의 순서를 기억해야 하는 지연 회상 과제를 완료하지 못했습니다.
ChatGPT 4o가 30점 만점에 26점으로 선두를 차지했고, ChatGPT 4와 Claude가 각각 25점으로 그 뒤를 이었습니다.
제미니 1.0은 16점으로 가장 낮은 점수를 받아 인지 장애의 정도가 더 높은 것으로 나타났습니다.
이 연구는 다음과 같이 언급했습니다:
조사 대상 챗봇 중 30점 만점을 받은 챗봇은 없었으며, 대부분 기준점인 26점 미만을 기록했습니다. 이는 경미한 인지 장애 및 초기 치매 가능성을 나타냅니다;
이 연구에 따르면 이러한 AI 모델이 보여준 인지 장애는 알츠하이머병의 한 형태인 후피질 위축증을 앓고 있는 인간 환자에서 관찰된 것과 유사했습니다.
이러한 발견은 다음과 같은 개념에 도전합니다.AI 챗봇의 인지 능력의 한계로 인해 의료 진단의 신뢰성에 영향을 미치고 환자의 신뢰를 약화시킬 수 있기 때문에 곧 인간 의사를 대체할 수 있습니다.
이 연구는 AI가 조만간 신경과 의사를 대체할 가능성은 낮다는 결론을 내렸지만, 의료 전문가들이 곧 인지 기능 저하를 경험하는 새로운 종류의 환자, 즉 가상 AI 모델을 치료할 수 있다는 흥미로운 가능성을 제기했습니다.
모든 것을 잃지 않고 성능을 향상시킬 수 있습니다.
이 연구는 다음과 같은 사실을 인정했지만AI 의 현재 인지적 한계와 함께, 앞으로의 발전이 인지 및 시각 공간 기술과 관련된 작업의 수행 능력을 향상시킬 수 있음을 시사했습니다.
그러나 이러한 잠재적인 개선에도 불구하고 인간과 기계의 인지 능력의 근본적인 차이는 여전히 남아있을 것이라고 강조했습니다.
이 연구는 다음과 같이 덧붙였습니다:
본문에서 인공지능에 의인화된 모든 용어는 비유로만 사용되었으며 컴퓨터 프로그램이 인간과 유사한 방식으로 신경 퇴행성 질환을 가질 수 있다는 것을 암시하기 위한 의도가 아닙니다;