딥시크, 투명한 AI 도입
중국에 본사를 둔 AI 기업 는 추론 및 문제 해결 능력을 크게 향상시킨 최신 AI 시스템인 DeepSeek-R1-Lite-Preview를 공개했습니다.
OpenAI의 o1의 경쟁자로 자리매김한 이 시스템은 투명성을 높이고 복잡한 쿼리를 처리하는 방식을 개선함으로써 차별화됩니다.
뉘앙스를 간과하는 경우가 많은 기존 모델과 달리 DeepSeek-R1-Lite는 사실 확인에 더 많은 시간을 할애하고 질문을 철저히 검토하여 일반적인 오류를 줄입니다.
다음과 유사OpenAI DeepSeek-R1은 단계별로 응답을 계획하고 복잡한 문의에 최대 수십 초를 소비하여 정확성을 보장합니다.
논평가들은 특히 아직 추론의 격차를 완전히 해결하지 못한 서구 모델과 비교할 때, 딥시크의 투명성에 아이러니가 있다고 지적했습니다.
딥시크릿의 최신 버전은 이미 수학적, 논리적 능력을 평가하는 미국 수학능력시험(AIME) 및 MATH와 같은 문제 해결 벤치마크에서 인상적인 결과를 입증한 바 있습니다.
이러한 성능으로 인해 DeepSeek-R1은 다음과 같은 강력한 경쟁자로 자리매김했습니다.OpenAI 의 ChatGPT와 특화된 o1 모델입니다.
함께제너레이티브 AI 빠르게 발전하고 있는 딥시크-R1-라이트-프리뷰의 출시와 미스트랄 AI의 최근 업데이트된 르챗은 AI 분야의 경쟁이 치열해지면서 기업들이 약점을 해결하고 더욱 강력하고 투명한 솔루션을 제공하도록 촉구하고 있습니다.
단계별 추론에서 승리하는 DeepSeek
딥시크는 단계별 실시간 추론을 제공하여 투명성을 높이고 사용자가 사고 과정을 더 잘 이해할 수 있도록 하는 AI의 기능을 강조합니다.
이 기능 외에도 조만간 API를 통해 오픈소스 모델과 개발자 도구를 공개할 계획입니다.
AI 전문가 앤드류 커런(Andrew Curran)의 최근 비교 차트에 따르면 DeepSeek-R1-Lite-Preview는 AIME(52.5) 및 Codeforces(1450)와 같은 주요 지표에서 OpenAI의 o1-preview 및 Claude 3.5 Sonnet과 같은 경쟁사보다 성능이 뛰어날 뿐만 아니라 MATH-500(91.6) 같은 고급 문제 해결 작업에서도 뛰어난 성능을 발휘합니다.
그러나 OpenAI의 o1-preview가 더 나은 성능을 보이는 GPQA Diamond(58.5점) 및 Zebra Logic(56.6점)과 같은 영역에서는 각각 73.3점 및 71.4점으로 뒤쳐졌습니다.
이 수치는 딥시크의AI 는 특정 고급 추론 영역에서 상당한 가능성을 보였지만, 일반적인 지식과 논리적 추론에서는 아직 개선의 여지가 남아 있습니다.
주요 연구소의 AI 모델이 최소한의 개선만 이뤄지고 있습니다.
딥시크릿의 AI는 탈옥에 취약하여 사용자가 안전 장치를 우회하는 방식으로 모델을 유도할 수 있다는 점에서 우려를 불러일으켰습니다.
예를 들어X(이전의 트위터) 사용자가 AI에게 자세한 마약 제조법을 알려달라고 요청하는 데 성공했습니다.
반면, DeepSeek-R1은 특히 중국 지도부, 천안문 광장 같은 사건 또는 대만과 같은 논쟁적인 지정학적 주제와 관련된 정치적 쿼리에 매우 민감합니다.
이 동작의 원인은 다음과 같습니다.중국의 규제 압력 에서 AI 모델은 정부의 '핵심 사회주의 가치'를 준수해야 하며, 해당 국가의 인터넷 규제 기관의 감시를 받아야 합니다.
보고서에 따르면 중국의 AI 시스템은 종종 특정 소스를 사용하지 못하도록 제한되어 있으며, 그 결과 국가 명령을 준수하기 위해 정치적으로 민감한 주제에 대한 응답을 피하는 모델이 개발되고 있다고 합니다.
이러한 규제 과제가 전개됨에 따라 광범위한 AI 커뮤니티는 '확장 법칙'이라는 오랜 개념을 재평가하고 있습니다;
이 이론은 데이터와 컴퓨팅 성능이 증가하면 모델의 성능이 지속적으로 향상된다는 가설을 세웠습니다.
그러나 최근 보고서에 따르면 OpenAI와 같은 주요 연구소의 모델도 마찬가지입니다,Google 와 Anthropic은 더 이상 예전과 같은 빠른 발전을 보여주지 못하고 있습니다.
이러한 변화는 테스트 시간 컴퓨팅을 비롯한 대안적인 AI 접근 방식, 아키텍처 및 기법에 대한 탐색을 촉발시켰으며, 이는 o1 및 DeepSeek-R1과 같은 모델에서 볼 수 있는 혁신입니다.
추론 컴퓨팅이라고도 하는 이 방법은 작업을 완료하는 동안 모델에 추가 처리 시간을 부여하여 기존 확장 방법의 한계를 극복할 수 있는 잠재적인 경로를 제공합니다.
OpenAI의 ChatGPT보다 낫냐는 질문에는 아래와 같이 답변을 회피했습니다.
DeepSeek 자세히 알아보기
딥시크는 딥시크-R1 모델을 오픈소스화하고 API를 공개할 계획인 회사로, AI 환경 내에서 흥미로운 틈새 시장을 공략하고 있습니다.
하이플라이어 캐피털 매니지먼트의 지원을 받아중국어 트레이딩 결정에 AI를 활용하는 퀀트 헤지펀드인 딥시크릿의 접근 방식은 야심차고 전략적입니다.
초기 혁신 중 하나인 텍스트와 이미지를 모두 분석하는 범용 DeepSeek-V2는 바이트댄스, 바이두, 그리고 다음과 같은 주요 경쟁사들을 자극했습니다.Alibaba 모델 사용료를 낮추고 특정 서비스를 완전히 무료로 제공하기도 합니다.
AI 인프라에 상당한 규모의 투자를 하는 것으로 유명한 High-Flyer는 모델 학습을 위해 자체 서버 클러스터를 구축합니다.
최신 버전은 10,000개의 엔비디아 A100 GPU를 탑재하고 있으며, 가격은 10억 엔(약 1억 3,800만 달러)에 육박하는 것으로 알려졌습니다.
컴퓨터 공학 졸업생인 리앙 웬펑이 설립한 하이플라이어 캐피털 매니지먼트는 딥시크를 통해 AI의 한계를 뛰어넘어 AI의 미래를 재정의할 수 있는 '초지능' 시스템 개발을 목표로 하고 있습니다.