지난 반년 동안 AI업계의 분위기가 좀 급변하고 있다는 걸 느끼셨나요?
작년 이맘때만 해도, 다들 컴퓨팅 성능 가격 인하 소식에 열광했었죠. 알리클라우드가 앞장서서 “최대 60% 인하”라고 외쳤고, 텐센트 클라우드, 화웨이 클라우드, 바이두 클라우드가 일제히 뒤를 이었고, 그 기세는 마치 ‘더블 11’ 대세일 같았다. 창업 그룹에서는 매일 누군가 청구서를 자랑하곤 했다. “봐, 내 100만 토큰이 고작 몇 푼밖에 안 들었어!” 그때만 해도 모두가 AI창업의 봄이 왔다고 생각했다. 컴퓨팅 파워가 배추처럼 싸니, 누가 대형 모델 애플리케이션을 만들지 못하겠는가?
결과는? 현실의 타격이 너무 빨랐다.
지난달만 해도 분위기가 180도 바뀌었다. 구글, 아마존, 텐센트, 알리바바, 바이두, 10일 이내에 모두 가격 인상 공지를 냈다. 얼마나 올랐나? 대체로30%에서50%까지. 가장 과감한 조치는 텐센트 클라우드였는데, 핵심 제품 하나가 무려400%나나 올랐습니다.
“폭락 세일”에서 “로켓처럼 치솟는 가격”으로, 불과 1년도 채 되지 않았습니다. 도대체 무슨 일이 일어난 걸까요? 누가 뒤에서 가격을 밀어 올리고 있는 걸까요? 더 중요한 것은, 이번 가격 인상 물결 속에서 누가 가장 큰 타격을 입었는지, 누가 은근히 웃고 있을까?
작년에는 아직“파격 할인”을 하던데, 올해는 왜 일제히 가격을 올리는 걸까?
먼저 이 “반전 드라마”를 간단히 되짚어 보자.
2025년4월, 알리클라우드는 먼저 폭탄 선언을 내놨다: 핵심 제품의 가격을 최대 60%까지 인하한다. 이는 단순한 소동이 아니라, 말 그대로 “반값에 추가 할인”을 단행한 것이다. 곧이어 징동클라우드가 “마음대로 내리라, 나도 따라가겠다”고 선언했고, 텐센트클라우드, 화웨이클라우드, 바이두클라우드가 모두 뒤를 이었다. 한순간에 컴퓨팅 성능 시장은 전쟁터가 되었고, 가격 전쟁은 그야말로 난리법석이었다.
그 당시의 슬로건은 무엇이었을까?“AI를 누구나 부담 없이 사용할 수 있게 하자”, “컴퓨팅 자원의 대중화” .많은 스타트업이 이를 진심으로 믿고, 대대적으로 토큰을 소진하며모델을 실행하기 시작했습니다.
하지만 공짜 점심은 오래가지 못합니다.
2026년1월, 아마존AWS는 조용히 한 가지 조치를 취했다 ——어떤 발표회도, 예고도 없이, 바로 EC2서버 가격을 15%가량 인상했다. 인상 폭은 크지 않아 보이지만, 그 의미는 매우 큽니다. 이는 클라우드 서비스 업계에서 지난 20년 만에 처음으로 발생한 가격 인상입니다. 아시다시피, 지난 20년 동안 AWS는 100회 이상 가격을 인하했으며, 오직 하락세만 이어져 왔을 뿐, 인상할 이유가 없었습니다.
이번 조치는 마치 도미노를 쓰러뜨린 것과 같습니다.
3월11일, 텐센트 클라우드가 뒤를 이어 자사의Tencent HY2.0 Instruct모델 입력 가격이 0.0008위안/천토큰에서0.004505위안/천토큰——상승폭463%, 4배 이상. 3월18일, 알리클라우드가 컴퓨팅 파워 카드 제품의 가격을 5%에서 34%까지 인상한다고 발표했고, 바이두 스마트 클라우드도 이에 따라 가격을 5%에서30%까지 인상했다. 이전에 무료 공개 테스트를 진행했던 대형 모델들, 예를 들어 GLM 5, MiniMax 2.5Kimi 2.5와 같이, 모두 “무료 이용 기간”을 종료하고 정식 과금 단계로 전환되었습니다.
“서둘러 가격 인하”에서 “서둘러 가격 인상”으로, 왜 이렇게 빨리 변한 것일까?
겉보기에는 클라우드 업체들이 더 이상 버티지 못한 것 같다. GPU칩은 살수록 비싸지고, 데이터센터의 전기료가 운영 비용의40%에서60%까지달하고, 게다가2025년 하반기부터 저장 칩 가격도 오르기 시작하면서, 비용 측면의 압박이 실감 나게 다가오고 있다. 하지만 가격 인상을 ‘어쩔 수 없는 선택’으로 만든 진짜 이유는 또 다른, 더 근본적인 원인이다. 바로 연산 능력이 정말로 부족해졌기 때문이다. span>
누가 미친 듯이“먹어치우고”Token을? 140조 원 규모의 진실
이전에는 해시 파워가 과잉이라고 하지 않았나요? 어떻게 갑자기 부족해진 걸까요?
정답은:토큰이 너무 빨리 '소진'되었기 때문입니다.
국가데이터국 국장 류리헝이 올해3월에 공개한 데이터에 따르면: 2026년3월까지, 중국의 일일 토큰호출량은 이미 140조를 돌파했다.
이 수치가 얼마나 엄청난지 아시나요? 두 가지 참고 자료를 드리겠습니다:
· 2024년 초, 이 수치는 고작1000억에 불과했습니다. 2년 만에 1,000배 이상 증가했습니다.
· 2025년 말, 이 수치는 100조입니다. 즉, 불과 지난 3개월 동안만 해도 40% ——단 3개월 동안 새로 증가한 규모(40조)만 해도, 이는 2024년 초 하루 전체의 400배에 달합니다.
이것은 선형적인 성장이 아니라, 쓰나미와 같습니다.
그렇다면 의문이 생깁니다: 누가 미친 듯이 토큰을 소비하고 있는 걸까요?
답은 딱 한 단어입니다: 에이전트(Agent).
작년부터 오픈소스 에이전트OpenClaw(일명 “랍스터”)를 대표하는 제품들이 엄청난 인기를 끌고 있습니다. span>AI는 단순히 “대화”만 하던 로봇에서, 항공권 예약, 코드 작성, PPT작성, 데이터 분석 등을 도와주는 “일하는” 조수로 변모했습니다…… 정말 멋지죠? 하지만 그 대가로, AI가 간단한 일을 하나 처리하는 데 소모하는토큰는 일반 대화의 10배에서 100배에 달합니다.
예를 들어, AI가 크롤러 스크립트를 작성해 주도록 하는 경우를 생각해 봅시다. 일반적인 대화라면, AI가 코드 한 단락을 제공하면 복사해서 가져가면 되므로 수백 개의 Token만 소모됩니다. 하지만 에이전트라면, 스스로 코드를 실행하고, 오류를 보고하고, 디버깅하고, 다시 실행하고, 다시 디버깅하는 과정을… …이 과정을 십여 차례나 반복하다 보면, 토큰소모량이 순식간에 수만 개로 치솟습니다.
영상을 생성하는 “금먹는 괴물” 같은 작업은 말할 것도 없습니다. 분석에 따르면, 1분짜리 영상을 생성하는 데 약 10조토큰을 소모한다고 한다. 그런데 현재의 동영상 모델은, 5초짜 동영상을 생성하는 데도 고작 몇 십 원에서 몇 천 원 정도만 받는다——이건 돈을 버는 게 아니라, 명성을 얻기 위해 손해를 감수하는 셈이다. 하지만 사용하는 사람이 너무 많으니 어쩔 수 없다, 영상, 음악, 코드, 데이터 분석…… 모든 분야에서 미친 듯이 토큰을 '먹어치우고' 있습니다.
공급이 수요를 따라가지 못하니, 컴퓨팅 파워 가격은 자연스럽게 오를 수밖에 없다. 이건 음모가 아니라, 노골적인 수급 불균형이다.
컴퓨팅 파워 순위 경쟁: 대기업은 고기를 먹고, 소규모 업체는 국물 한 방울도 못 마신다
가격 인상이라는 일은 사람에 따라 그 의미가 완전히 다릅니다.
클라우드 업체에게 가격 인상은 사실 좋은 일입니다. 한 증권사가 계산해 본 바에 따르면, 알리클라우드가 가격을 1% 인상할 때마다1%씩 인상할 때마다, 그 이익률은1퍼센트 포인트 상승한다. 그래서 볼 수 있는 데이터는, 알리클라우드의 점유율이 떨어지기는커녕 오히려 상승하여 이미 중국AI클라우드 시장의36%를 차지하고 있습니다. 그리고AI호출량이라는 더 세분화된 분야에서, 화산엔진(바이트댄스 계열사)은 무려 50%에 육박한다——즉, 중국 전체의 절반에 달하는토큰호출이 화산엔진의 경로를 통해 이루어지고 있다.
한편, 화웨이 클라우드와 텐센트 클라우드의 점유율은 소폭 하락하고 있다. 선두 효과는 점점 더 뚜렷해지고 있다: 대기업은 점점 더 강해지고, 자원은 점점 더 집중되고 있다.
그렇다면 누가 가장 큰 타격을 입었을까?
중소AI스타트업과 시장에 막 진입한 소규모 업체들입니다.
이유는 간단합니다. 가격 인상이 이들의 운영 비용을 직접적으로 끌어올렸기 때문입니다. 예전토큰가격이 저렴했을 때는, 얼마 안 드는 비용이라 마음껏 실험을 돌리고 모델을 조정할 수 있었습니다. 지금은 가격이 몇 배, 심지어 십여 배나 뛰었기에, 훈련 한 번, 추론 한 번 할 때마다 신중하게 따져봐야 한다.
더 큰 문제는 소규모 업체들이 가격 협상력이 없다는 점이다. 대기업은 클라우드 업체와 장기 계약을 맺어 상대적으로 유리한 가격을 고정할 수 있다. 하지만 연산 비용으로 1년에 고작 몇만 위안밖에 쓰지 않는 스타트업이라면, 누가 당신에게 할인을 해줄까요? 어쩔 수 없이 인상된 가격대로 성실히 지불할 수밖에 없습니다.
원래 AI응용 프로그램을 만들 계획이었던 많은 프로젝트가, 비용을 계산해 본 후 조용히 보류되었습니다. 이미 진행 중인 프로젝트들도 규모를 축소하거나, 손실을 감수하며 버티는 경우가 많습니다. 게다가 최종 시장 경쟁은 치열해서 사용자에게 쉽게 가격을 올릴 수도 없습니다. 옆집은 무료로 제공하는데, 요금을 받으면 사용자가 모두 떠나버리니까요. 결국 모든 비용 부담은 스스로 감당할 수밖에 없습니다.
한 업계 종사자가 나에게 불만을 털어놓았다:“예전에는 컴퓨팅 파워가 저렴해서 창업 진입 장벽이 낮아졌다고 생각했죠. 이제야 깨달았어요. 장벽이 낮아진 게 아니라, 일단 들어오게 해놓고는 문을 닫아버리는 거였어요.”
사실 이것은 잔혹한 순위 경쟁이다. 지난 20년 동안 클라우드 업체들은 “저가로 물량을 늘리고, 먼저 시장을 선점한 뒤 수익을 내는” 전략으로 호황을 누렸다. 하지만 그 시대는 끝났다. 컴퓨팅 파워는 공식적으로 보조금 지원 기간을 마감하고, 상업적 가격 책정 단계로 접어들었다. 앞으로 경쟁의 핵심은 누가 더 저렴한가가 아니라, 누가 더 안정적인 서비스를 제공하고, 누가 더 완벽한 생태계를 갖추었으며, 누가 기업이 컴퓨팅 파워를 한 푼도 낭비하지 않고 제대로 활용할 수 있도록 돕느냐에 달려 있다.
그리고 이 순위 경쟁에서 소규모 업체들은 대부분 도태될 가능성이 높다.
지난 1년여간의 롤러코스터 같은 여정을 되돌아보면, 꽤 가슴 아픈 진실을 발견하게 될 것이다:
컴퓨팅 파워가 “헐값”에서 “천정부지”로, 본질적으로는AI산업이 무분별한 성장에서 성숙기로 접어든 단면이다. 무료 시대는 끝났고, 가치 경쟁이 시작되었다. 보조금에 의존해 살아가던 비즈니스 모델은 사라질 것이며, 진정한 기술과 시나리오와 사용자를 갖춘 제품만이 컴퓨팅 비용 상승 환경 속에서 살아남을 뿐만 아니라, 오히려 더 잘 살아남을 것이다.
AI창업의 핵심 경쟁력은 결코 컴퓨팅 비용이 얼마나 저렴한가가 아니라, 그 컴퓨팅 능력을 무엇에 활용하느냐에 달려 있다. span>
컴퓨팅 파워 시대,토큰은 확실히 비쌉니다. 하지만 토큰보다 더 비싼 것은, 토큰을 어떻게 잘 활용할지 아는 두뇌입니다.