SLM이 차세대 게임 체인저가 될까요?
동안AI 산업 는 여전히 대규모 언어 모델(LLM)에 집중하고 있지만, 점점 더 많은 전문가들이 소규모 언어 모델(SLM)이 곧 중심이 될 것이라고 믿고 있습니다.
기술 기업들이 다음 분야에 대한 투자를 늘리면서제너레이티브 AI 분주한 연말연시에는 모놀리식 시스템보다 맞춤형 솔루션이 필요하다는 쪽으로 논의의 중심이 옮겨가고 있습니다.
LLM은 다양한 작업을 처리하는 데 탁월하지만 리소스 집약적인 경우가 많아 비용, 에너지 소비, 컴퓨팅 요구 사항에서 어려움을 겪을 수 있습니다.
AWS의 CEO 매트 가먼에 따르면, 이미 앤트로픽과 같은 모델을 기반으로 하는 생성형 AI를 활용하는 기업에서 상당한 관심을 보이고 있습니다.
하지만 LLM은 일부 분야에서 지배적이기는 하지만 보편적으로 적합한 것은 아닙니다.
테라데이타의 CEO 스티븐 맥밀란은 SLM을 다음과 같이 옹호합니다.AI의 미래, 작업별 결과물을 제공할 수 있는 능력을 강조합니다.
맥밀란은 이렇게 말했습니다:
"미래를 내다볼 때 중소규모 언어 모델과 도메인별 LLM과 같은 제어 환경이 훨씬 더 나은 솔루션을 제공할 수 있을 것으로 생각합니다."
SLM은 데이터 프라이버시를 보장하면서 관련성이 높은 인사이트를 제공하기 위해 특정 데이터 세트에 대해 학습된 특수 목적으로 구축되었습니다.
대형 제품과 달리 에너지 및 컴퓨팅 리소스를 최적화하여 프로젝트의 필요에 따라 확장할 수 있으므로 비용 효율적이고 효율적인 대안을 제공합니다.
특정 도메인에 대한 심층적인 전문 지식이 필요한 비즈니스의 경우 도메인별 LLM이든 SLM이든 전문화된 모델이 탁월한 정확도를 제공합니다. 예를 들어 최고 마케팅 책임자(CMO)를 위한 모델과 최고 재무 책임자(CFO)를 위한 모델은 해당 교육 분야에서 고도로 맥락적이고 관련성 높은 인사이트를 제공합니다.
AI 환경이 진화함에 따라 SLM의 부상은 지능형 시스템의 미래를 재정의할 수 있는 정밀성, 효율성, 확장성에 대한 요구가 증가하고 있음을 보여줍니다.
SLM이 더 나은 옵션인가요?
데이터 과학자 협회(ADaSci)는 100만 명의 사용자에게 서비스를 제공하기 위해 70억 개의 매개 변수가 있는 SLM을 개발하는 데 55.1MWh(메가와트시)의 전기만 필요할 것으로 추정합니다.
이와는 대조적으로, 교육GPT-3 는 1,750억 개의 파라미터를 사용하여 무려 1,287MWh의 에너지를 소비했으며, 이는 모델이 활발하게 배포될 때 사용되는 에너지를 고려하지 않은 수치입니다.
즉, SLM은 LLM에 필요한 에너지의 약 5%만 사용합니다.
대규모 연산이 필요한 LLM은 일반적으로 클라우드 서버에서 실행되기 때문에 기업이 데이터에 대한 통제력을 잃고 정보가 인터넷을 통해 이동함에 따라 응답 시간이 느려지는 경우가 많습니다.
점점 더 많은 기업이AI, 한 가지 사이즈가 모든 사람에게 적합하지 않다는 것은 분명합니다.
기업은 범용 LLM이든 더 작고 전문화된 모델이든 각 프로젝트에 가장 적합한 모델을 선택하여 효율성, 비용 효과, 클라우드로의 데이터 전송 최소화를 우선순위로 삼습니다.
이렇게 진화하는 환경에서는 효율성과 정확성이 가장 중요해집니다.
맥밀란이 말했습니다:
"AI 모델을 학습시킬 때는 반드시 훌륭한 데이터의 토대 위에 구축되어야 합니다."
그는 덧붙였습니다:
"신뢰할 수 있는 데이터 세트를 제공하고 고객과 고객이 그 결과물을 신뢰할 수 있도록 기능과 분석 기능을 제공하는 것이 바로 저희의 목표입니다."
소규모의 도메인별 LLM은 매력적인 대안이 될 수 있으며, 기업은 이를 통해AI의 힘 대규모 모델의 막대한 리소스 비용과 복잡성 없이도 가능합니다.
AI가 비즈니스 의사 결정의 중심이 되면서 각 작업에 적합한 모델을 선택하여 안정적이고 확장 가능한 결과를 보장하는 것이 중요해질 것입니다.