출처: 해외 유니콘
24분기부터 우리는 인공지능의 하반기에 대해 이야기하고 있는데, OpenAI o1이 RL 내러티브를 제안했지만 여러 가지 이유로 고리를 끊지 못했지만 DeepSeek R1은 RL의 퍼즐을 풀고 전체 산업을 새로운 패러다임으로 밀어 넣으며 정말 지능의 후반기에 접어들었다.
딥시크가 무엇이고 왜 필요한지에 대해 시장에서 많은 논의가 있었고, 그 다음으로 더 가치 있는 논의는 인공지능 경쟁에서 어떻게 경쟁할 것인가? 지난 보름 동안의 제 생각을 정리해 보았는데, 이 글이 경쟁의 후반부를 탐색하기 위한 로드맵이 되길 바라며, 가끔씩 다시 찾아뵙겠습니다. 또한 가장 궁금했던 질문 몇 가지를 나열하고, 함께 설문지를 작성하여 아이디어를 교환하는 것을 환영하며, 다음 지능형 돌파구 아하 순간을 중심으로 소규모 토론을 진행할 예정입니다.
- 다음 지능형 돌파구 아하 순간은 어디에서 나타날까요?
-탐색을 위한 충분한 자원이 있다면 어떤 방향에 투자하겠는가? 예를 들어, 차세대 트랜스포머 아키텍처, 합성 데이터의 혁신, 온라인 학습을 통한 보다 효율적인 학습 방법 등을 위해 어떤 베팅을 하시겠습니까?
-
-
Insight < strong>01 DeepSeek가 OpenAI를 능가할까요?
딥시크가 메타 라마를 능가한 것은 분명하지만, 딥시크보다 비용이 저렴하고 성능이 뛰어나며 완전한 모달을 갖춘 제미니 2.0 플래시와 같은 오픈AI, 앤트로픽, 구글 같은 1단계 업체와는 아직 거리가 멀다. Gemini 2.0으로 대표되는 첫 번째 계층의 능력을 과소평가하고 있지만, 이렇게 폭발적이고 놀라운 결과를 얻기 위한 오픈 소스는 아닙니다.
딥시크는 매우 흥미롭지만 패러다임의 혁신이라기보다는 OpenAI o1이 반쯤 가려져 있던 패러다임을 오픈소스로 공개하고 전체 생태계를 매우 높은 보급률로 끌어올렸다는 표현이 더 정확할 것입니다.
원론적인 관점에서 볼 때, 현 세대 아키텍처에서는 트랜스포머의 1세대 모델 벤더를 뛰어넘기 어렵고, 같은 경로를 따라잡을 수 있는 가능성도 현실적으로 기대하기 어렵기 때문에 차세대 지능형 아키텍처와 패러다임을 개척하는 누군가가 더욱 기대되는 시점입니다.

DeepSeek는 OpenAI와 Anthropic을 따라잡는 데 1년이 걸렸습니다.
Insight strong>02 DeepSeek는 새로운 패러다임을 시작했나요?
앞에서도 언급했듯이, DeepSeek는 기술적으로 새로운 패러다임을 발명하지는 않았습니다.
그러나 딥시크는 RL과 테스트 시간 계산이라는 새로운 패러다임이 실제로 등장하도록 돕는 데 중요한 역할을 합니다. 오픈AI의 초기 o1 출시가 업계에 수수께끼였다면, 딥시크는 이를 최초로 공개적으로 풀었습니다.
딥시크가 R1과 R1-zero를 출시하기 전에는 RL과 추론 모델을 연습하는 사람이 소수에 불과했지만, 딥시크는 모두에게 로드맵을 제시하고 그렇게 하면 실제로 지능이 향상될 것이라고 업계에 확신시켰으며, 이는 새로운 패러다임에 대한 자신감을 높이고 더 많은 AI 연구자들을 끌어들이는 데 큰 도움이 되었습니다. 패러다임.
인재 유입은 알고리즘 혁신으로 이어지고, 오픈 소스 추격은 더 많은 컴퓨팅 리소스로 이어집니다. 업계의 새로운 패러다임의 발전은 DeepSeek에 의해 가속화되었으며 중소 규모 팀은 다양한 도메인에서 RL을 시도할 수 있습니다.
또한 추론 모델의 향상은 에이전트의 착륙을 더욱 도울 것이며 AI 연구원은 이제 에이전트의 연구 및 탐색에 더욱 확신을 갖게 되었습니다. 딥시크의 오픈 소스 추론 모델은 업계에서 에이전트에 대한 더 많은 탐색을 가능하게 했습니다.
그러므로 DeepSeek는 새로운 패러다임을 발명하지는 못했지만, 업계를 하나의 패러다임으로 이끌었습니다.
Insight 03 앤트로픽의 기술 경로가 R1과 어떻게 다른가요?
다리오의 인터뷰를 보면 R-1/추론 모델에 대한 앤트로픽의 이해가 O 시리즈와는 조금 다르다는 것을 알 수 있는데, 다리오는 기본 모델과 추론 모델이 OpenAI처럼 별도의 모델 시리즈가 아니라 하나의 연속체라고 생각하고 있습니다. O 시리즈만 하면 곧 한계에 부딪힐 테니까요.
소네트 3.5의 코딩, 추론, 에이전트 기능이 한꺼번에 많이 향상됐는데 4o는 왜 따라잡지 못했는지 항상 궁금했습니다.
사전 학습 기본 모델 단계에서 많은 RL 작업을 했고, 여전히 핵심은 기본 모델을 끌어올리는 것인데, 그렇지 않으면 추론 모델을 개선하기 위해 RL에만 의존해 이득을 먹어치우기 쉬울 수 있습니다.
Insight04 DeepSeek의 센세이셔널리즘은 필연이자 우연
초기 OpenAI 펠로우 두 명이 쓴 "왜 위대함은 계획될 수 없는가"라는 책에서 DeepSeek에 대해 설명합니다. 두 명의 초기 OpenAI 연구원이 쓴 "왜 위대함은 계획될 수 없는가"는 DeepSeek에 대해 적절하게 설명합니다.
기술적으로 DeepSeek의 주요 특징은 다음과 같습니다.
- 오픈 소스: 오픈 소스는 중요하며, GPT-3에서 비공개 소스 회사가 된 OpenAI의 첫 번째 세 거대 기업은 더 이상 기술 세부 정보를 공개하지 않습니다. 처음 세 거대 기업은 OpenAI가 GPT-3에서 비공개 소스로 전환한 후 기술 세부 정보 공개를 중단하면서 오픈소스 생태계가 공허해졌지만, Meta와 Mistral이 그 자리를 대신했고, DeepSeek가 오픈소스 분야에서 좋은 출발을 보였습니다.
선정성 100점, 지능 향상 30점, 오픈소스 70점이라면, LLaMA가 이전에 오픈소스였으나 선풍적이지 않았다는 사실은 LLaMA가 충분히 지능적이지 않다는 것을 보여줍니다.
- Cheap: "당신의 마진이 나의 기회"라는 말이 여전히 떠오르고 있습니다.
- 네트워킹 + 공개 CoT: 이 두 가지 포인트의 사용자는 각각 매우 좋은 사용자 경험을 가져올 수 있으며, DeepSeek는 두 카드를 동시에 넣고 폭탄의 왕이라고 할 수 있으며 C- 사용자 경험과 다른 챗봇과는 완전히 다릅니다. 특히 CoT 투명성, 모델 사고 프로세스는 개방적이며 투명성은 사용자가 AI를 더 신뢰하고 깨진 원을 촉진 할 수 있습니다. 하지만 퍼플렉시티도 큰 인기를 끌었지만, 딥시크 서버가 불안정했고, 퍼플렉시티 팀은 R-1을 출시하여 빠르게 대응했고, 그 결과 딥시크 R-1의 오버플로우가 많이 발생했습니다.
- RL 일반화: RL은 OpenAI o1에서 처음 제안했지만 다양한 연산이 반쯤 숨겨져 있어 보급률이 높지 않았지만, DeepSeek R-1은 추론 모델 패러다임 프로세스의 큰 의미로 생태학적 수용도가 급격히 증가했습니다. DeepSeek R-1은 추론 모델 패러다임을 크게 발전시켰으며 생태학적 수용성이 크게 증가했습니다.
기술 탐사에 대한 딥시크의 투자는 더 많은 관심과 논의가 필요한 것이 확실하지만, 딥시크 R1의 출시 시기는 이를 더욱 특별하게 만들었다.
과거에 미국은 항상 기초 기술 연구에서 상당한 진전을 이루었다고 말해왔다. 딥시크 R1은 미국에서 최초로 출시되는 딥시크 R1이고, 딥시크 R1은 미국에서 최초로 출시되는 딥시크 R1이고, 딥시크 R1은 미국에서 최초로 출시되는 딥시크 R1이고, 딥시크 R1은 미국에서 출시되는 두 번째 딥시크 R1이고, 딥시크 R1은 미국에서 출시되는 세 번째 딥시크 R1이고, 딥시크 R1은 미국에서 세 번째 딥시크 R1이고, 딥시크 R1은 미국에서 출시되는 딥시크 R1이고, 딥시크 R1은 미국에서는 처음으로 출시되는 DeepSeek R1이고, 미국에서 출시되는 DeepSeek R1은 미국에서는 처음으로 출시되는 DeepSeek R1입니다. 딥시크 R1이 출시되기 전에 OpenAI 스타게이트 5000억 달러 이벤트가 막 발효되기 시작했고, 이 엄청난 양의 입력과 딥시크 팀 인텔리전스 출력 효율 대비가 너무 날카로워 우려, 토론을 일으키지 않기 어렵습니다.
- 딥시크는 엔비디아의 주가를 떨어뜨렸습니다. 딥 시크는 엔비디아의 주가를 폭락시키고 여론을 더욱 발효 시켰으며, 2025 년 개막 연도에 미국 주식 시장의 첫 번째 블랙 스완이되었다고 상상할 수 없을 것입니다 .
- 춘절은 제품의 연습장이며 모바일 인터넷 시대의 많은 슈퍼 앱이 춘절 발발에 있으며 AI 시대도 예외는 아닙니다 .
- DeepSeek R1은 춘절 이전에 출시되었으며 텍스트 생성 기능이 너무 좋아서 대중에게 놀라움을 선사하고 있습니다. 교육에서 강조하는 코딩과 수학적 능력보다는 텍스트 생성 능력이 더 놀라웠고, 텍스트 생성은 일반 사용자들이 체감할 가능성이 높으며, 입소문도 쉽게 날 수 있습니다.
Insight 05 누가 피해를 입나요? 누가 혜택을 받습니까?
이 분야의 플레이어를 ToC, 개발자, 기업(정부)의 세 가지 범주로 나눌 수 있습니다.
1. ToC: 챗봇은 확실히 가장 큰 타격을 받고 있습니다.
2. 개발자 부문에서는 영향이 매우 제한적이며, 일부 사용자가 r1을 사용한 후 소네트만큼 좋지 않다고 언급하는 것을 보았으며, 커서 관계자는 소네트가 여전히 성능이 우수하며 의외로 높은 비율의 사용자가 개발자 부문에서 좋은 선택인 소네트를 선택했다고 말했습니다.
3. 세 번째 차원은 To Enterprise와 To Government의 비즈니스는 요구 사항에 대한 신뢰와 이해에 있습니다. 대규모 조직은 복잡한 이해관계를 고려하여 결정을 내리기 때문에 최고 경영진 사용자만큼 쉽게 마이그레이션할 수 없습니다. 세 번째 차원은 요구 사항에 대한 신뢰와 이해입니다.
이 문제에 대해 폐쇄형 소스, 오픈 소스, 산술적 관점에서 생각해 보면 다음과 같습니다.
- 단기적으로 사람들은 폐쇄형 소스인 OpenAI/Anthropic/Google이 더 큰 영향을 미칠 것입니다.
- 오픈 소스에 의한 기술 미스터리, 프리미엄의 가장 중요한 미스터리 내부의 AI 과대광고가 깨졌습니다. 깨졌다;
- 보다 현실적인 요인으로, 시장에서는 이러한 폐쇄 소스 회사의 잠재 고객과 시장 규모가 투자 회수 주기가 길어짐에 따라 GPU 투자 일부를 빼앗겼다고 생각합니다.
- 가장 많이 속하는 OpenAI의 리더로서 "첫 번째는 OpenAI가 세계에서 가장 강력하고 가장 강력한 기술이며, 세계에서 가장 강력한 기술이며, 세계에서 가장 강력한 기술이며, 세계에서 가장 강력한 기술이라는 것입니다.
그러나 중장기적으로는 풍부한 GPU 리소스를 보유한 기업이 여전히 혜택을 받고 있으며, 한편으로는 Meta의 두 번째 계층이 새로운 방법을 신속하게 후속 조치 할 수 있고, Capex가 더 효율적이며, Meta는 큰 수혜자가 될 수 있으며, 반면에 지능 향상에는 더 많은 탐구가 필요하고, 모든 사람을 수준의 수준으로 끌어 올리고 새로운 탐구에 10 배의 시간이 필요합니다. 딥시크 오픈소스는 모든 사람을 동등한 수준으로 끌어올리고, 완전히 새로운 수준의 탐험에 도달하려면 10배 이상의 대규모 GPU 투자가 필요합니다.
첫 번째 원칙에서, AI 인텔리전스 산업은 인텔리전스의 개발이든 인텔리전스의 응용이든, 기술 최적화가 아닌 결정의 기초 법칙인 대규모 산술의 불가피한 소비라는 물리적 특성에서 완전히 회피할 수 없습니다.
따라서 지능을 탐구하든 지능을 적용하든 단기적인 문제가 있더라도 중장기적인 산술 수요도 폭발적으로 증가할 것이며, 이는 첫 번째 원칙에서 머스크가 클러스터의 확장을 고수하는 이유도, 더 깊은 논리 뒤에 있는 xAI와 스타게이트가 같은 이유일 수 있으며, 아마존과 다른 클라우드 벤더들은 업계 역사상 처음으로 &...
이것을 늘리겠다고 발표했습니다. 자본 지출 가이드라인.
전 세계의 AI 연구 인재와 인지 수준이 한데 모이고 있고, 더 많은 GPU가 있으면 더 많은 실험적 탐구가 가능하다고 가정해 봅시다. 결국은 컴퓨팅 경쟁으로 돌아올 수 있습니다.
맨발로 신발을 신는 것을 두려워하지 않고 상업적 매력이 없으며 AGI 지능형 기술 탐구에 초점을 맞춘이 작업을 오픈 소스화하여 경쟁 심화의 중요성을 홍보하고 개방성을 촉진하기 위해 AGI 프로세스를 홍보하고 메기 효과를 상당히 촉진합니다.
Insight 06 증류가 SOTA를 능가할 수 있습니까?
세부적으로는 불확실한 점이 있는데, 딥시크가 프리 트레인 단계에서 증류된 CoT 데이터를 많이 사용한다면 그 효과는 현재 또는 기본 인텔리전스의 어깨 위에 있는 거인들의 첫 번째 계층에서, 그리고 오픈 소스에서 놀랍지 않지만 프리 트레인 단계에서 증류된 데이터를 많이 사용하지 않는다면 많은 데이터를 사용하는 것은 좋은 생각이 아니다. 딥시크는 0에서 프리 트레이닝을 거쳐 오늘날과 같은 효과를 냈다니 놀랍습니다.
또한 증류가 기본 모델에서 SOTA를 능가할 가능성은 거의 없습니다. 하지만 딥시크 R-1은 매우 강력하며, 리워드 모델이 매우 잘하고 있고, R-1 제로 경로가 안정적이라면 SOTA를 능가할 가능성이 있습니다."
Insight 07
strong>
No Moat ! OpenAI에 대한 Google의 이전 코멘트 중 하나: No Moat !

DeepSeek의 대규모 챗봇 사용자 이동은 스마트 기술의 발전이 매우 가파르다는 중요한 통찰을 시장에 제공했습니다. 그리고 그 과정에서 가장 먼저 해야 할 일은 최상의 결과를 얻을 수 있는 최상의 기회를 확보하는 것입니다.
챗GPT/소넷/퍼플렉시티가 이제 막 마음과 평판을 형성했든, 커서, 윈드서프 개발자 도구가 더 똑똑한 제품이 나오면 '이전 세대' 지능형 제품의 사용자는 충성도가 없습니다. 더 똑똑한 제품이 나오면 사용자는 '이전' 세대의 스마트 제품에 대한 충성도가 없어지고, 모델 계층에서든 앱 계층에서든 오늘날 해자를 구축하기가 어렵습니다.
딥시크도 이번에 한 가지를 확인했습니다. 모델은 애플리케이션이고, 제품 형태의 딥시크에는 혁신이 없으며, 핵심은 지능형 + 오픈 소스이며, AI 시대에 어떤 제품 및 비즈니스 모델 혁신도 지능의 혁신만큼 좋지 않다고 생각할 수밖에 없습니다.
Insight 08 DeepSeek는 이 물결에 대응할 수 있어야 합니다. 챗봇 트래픽을 크게 만들 수 있을까요?
챗봇이 등장했을 때부터 지금까지, 딥시크 팀의 반응을 보면 딥시크가 이 트래픽을 어떻게 처리할지 고민하고 있다는 것을 알 수 있습니다.
이 트래픽을 받아 공격적으로 운영할지 여부에 대한 질문의 본질은 훌륭한 상업 기업과 훌륭한 연구소가 한 조직에 공존할 수 있는가 하는 것입니다.
이것은 에너지와 자원 할당, 조직 기술 및 전략적 선택에 대한 훌륭한 시험입니다. 만약 Byte나 Meta와 같은 큰 회사라면 가장 먼저 대응할 것이고 그렇게 할 수 있는 조직적 기반이 있겠지만, 연구실인 DeepSeek는 이 엄청난 트래픽을 감당하기에는 많은 압박을 받을 것입니다.
그러나 동시에 이 챗봇의 물결이 트래픽의 한 단계일지, 향후 챗봇이 지능형 탐색의 메인 라인이 될지에 대해서도 생각해야 합니다. 지능의 모든 단계에는 그에 상응하는 제품 형태가 있는 것처럼 보이며, 챗봇은 초기 형태 중 하나에 불과합니다.
딥시크의 경우 향후 3~5년의 관점에서 볼 때, 지금 챗봇 트래픽을 감당하지 못하면 언젠가 규모가 부족해져 실패할 수도 있을까요? 그리고 결국 AGI가 실현된다면 어떤 통신사가 이를 맡게 될까요?
Insight 09 다음 스마트 돌파구인 아하 순간은 어디에서 올까요?
한편으로는 퍼스트 티어의 차세대 모델이 중요한데, 현재 우리는 트랜스포머의 한계 경계에 와 있고 퍼스트 티어가 세대적으로 개선된 모델을 내놓을 수 있을지 불확실합니다. OpenAI, Anthropic, Google이 대응으로 내놓은 모델 중 30~50%만으로는 상황을 구하기에는 10~30% 더 많은 자원을 가지고 있기 때문에 충분하지 않을 수 있습니다. 반면에 에이전트 랜딩이 더 중요한데, 에이전트는 장거리 다단계 추론을 해야 하기 때문에 모델이 5~10%만 좋으면 선행 효과가 몇 배로 증폭되기 때문에 OpenAI, Anthropic, Google은 한편으로는 에이전트 제품 랜딩, 풀 스택 통합 모델 + 에이전트 제품, 즉 Windows + Office와 같은 제품을 만들어야 합니다. 그래서 OpenAI, Anthropic, Google은 한편으로는 Windows + Office처럼 에이전트 제품 랜딩, 풀 스택 통합 모델 + 에이전트 제품을 해야 하고, 다른 한편으로는 차세대 모델의 대표로 O3 풀 버전, 소네트 4/3.5 작품과 같은 더 강력한 모델을 선보여야 합니다.
기술적 불확실성 속에서 가장 가치 있는 것은 유능한 인공지능 연구자이며, AGI를 탐구하고자 하는 모든 조직은 다음 패러다임에 더 공격적으로 베팅하는 데 자원을 투자해야 하며, 특히 사전 훈련 단계가 도출된 오늘날의 상황에서는 좋은 인재 + 충분한 자원이 있어야 지능이 등장하는 다음 Aha 순간을 탐구할 수 있습니다.
다음 단계는 다음 패러다임이 무엇인지, 어떻게 작동하도록 만들고, 작동하도록 만드는 방법을 찾는 것이 필요합니다. 아하 순간.
Insight 10 이 물결을 깊이 들여다보자중국 AI 인재에 대해알아보자. 중국의 AI 인재, 매우 고무적입니다
마지막으로, 기술에는 국경이 없기를 바랍니다.