著者:Carl Franzen; Compiled by Deep Tide TechFlow
ほんの数日前まで、ディープシーク(DeepSeek)という名前を聞いたことがあるのは、最も専門的なオタクだけだった。2015年に設立された定量分析会社、ハイフライヤー・キャピタル・マネジメントの子会社である。しかしここ数日で、シリコンバレーで最も話題の企業になったかもしれない。
これは、DeepSeek-R1のリリースによるところが大きい。新しい大規模言語モデル(LLM)は、OpenAIの現在の最高モデルo1と同様の「推論」を行うことができる。-- 難しい質問に答えたり、複雑な問題を解決したりするために、ステップバイステップで、あるいは「思考の連鎖」アプローチで、数秒から数分かけて自身の分析を振り返ります。
それだけでなく、DeepSeek-R1は、幅広いトピックに関する質問に答えるAIのパフォーマンスを測定するさまざまなサードパーティーのベンチマークで、OpenAIのo1と同等かそれ以上のスコアを記録しています。GPU)は、米国(OpenAIの本拠地)で厳しく禁じられた金額よりもはるかに少ない。
しかし、有料のChatGPT Plus加入者(月額20ドル)以上の加入者(例えば、Proレベルで月額200ドル)しか利用できなかったo1とは異なり、DeepSeek-R1は完全なオープンソースモデルとしてリリースされた。なぜDeepSeek-R1は、AIコード共有コミュニティ「Hugging Face」において、最も人気がありアクティブなモデルのリストのトップにまで急速に上り詰めたのか。
また、完全なオープンソースであるため、モバイルデバイスで動作するように小型化したり、他のオープンソースモデルと組み合わせて使用するなど、さまざまな特定のタスクに適応させるために、人々はさまざまな方法でモデルを微調整し、訓練してきました。開発目的で使用する場合でも、DeepSeekのAPIコストは、OpenAIの同等のo1モデルよりも90%以上 安いです。
最も印象的なのは、ソフトウェアエンジニアでなくても使えるということだ。DeepSeekは、米国のユーザー向けに無料のウェブサイトとモバイルアプリを提供しており、そのR1駆動型チャットボットのインターフェースは、OpenAIのChatGPTに非常によく似ている。しかし、DeepSeekは、この強力な推論モデルをウェブ検索に接続することで、OpenAIを再び凌駕しています-OpenAIがまだ達成していないことです(ウェブ検索は現在、GPTファミリーの強力でないモデルでのみ利用可能です)。
明らかな皮肉
大衆のためにAIを民主化するというOpenAIの当初の目標を考えると、ここにはかなり興味深い、あるいは不穏な皮肉があります。Nvidiaのシニアリサーチマネージャーであるジム・ファンは、Xで次のように述べている。「我々は、米国以外の企業が、すべての人に力を与える真にオープンで最先端の研究というOpenAIの本来の使命を永続させるというタイムラインに生きている。それは理にかなっていない。しかし、最も興味深い結果は、しばしば最もありそうなことなのだ。"
また、Xユーザーの@SuspendedRobotが言うように(DeepSeekはChatGPTやその他のデータから生成されたQ&A出力で訓練されているようだという報告を引用して)、「OpenAIはインターネット全体からデータを盗んで、自分自身をよりリッチにしている。DeepSeekは彼らからデータを盗み、それを無料で一般に還元している。"と述べている。
オープンソースのLlamaが遅れをとり、Metaが危機に?
しかし、DeepSeekの成功に気づいたのはファンだけではない。さまざまなエンジニア、思想家、リーダーたちとの会話や読書に基づくと、DeepSeek-R1がオープンソースで利用可能であること、高性能であること、そしてかつてのジェネレーティブAIのリーダーたちに「どこからともなく」挑戦してきたように見えることは、シリコンバレー内外に衝撃を与えている。大げさなタイトルが示すように、「誰もが」熱狂しているわけではないにせよ、少なくともテック界やビジネス界ではホットな話題となっている。
Blind(シリコンバレーの匿名ゴシップ共有アプリ)に投稿されたメッセージは、LlamaモデルでオープンソースAIの王者になろうとするMeta自身の努力をあっという間に追い抜いたDeepSeekの成功のせいで、Metaが危機に瀕していることを示唆し、拡散している。
「これはゲーム全体を変える。これはゲーム全体を変える」
Xのユーザー@tphuangは、「DeepSeekは、AIをトップレベル以上にコモディティ化した」という説得力のある指摘をしています。最初の画像で目が覚めた。r1は米国よりもはるかに低い労働コストであり、今後5年間で多くの仕事がオートメーションに取って代わられることを意味する。" その後、彼はディープシークがなぜAIをコモディティ化したのかについて言及した。
「o1には3つの大きな問題がある:
1)遅すぎる。
2)高すぎる
3)エンドユーザーによるコントロールの欠如/OpenAIへの過度の依存
R1はこれらの問題をすべて解決します。企業は、追加コストやOpenAIサーバーの遅さ/反応の悪さを心配することなく、これらのモデルを実行するために独自のNvidia GPUを購入することができます。"
@tphaung はまた、"DeepSeekはLLMのAndroidになるのだろうか?"という示唆に富んだ例えを出した。
サイバー起業家のArnaud Bertrand氏はXで、DeepSeekの成功がもたらす驚異的な影響について率直に語った。これはAIに限ったことではなく、中国の技術開発を止めようとする米国の誤った試みに対する大きな皮肉でもあり、それがなければディープシークは生まれなかったかもしれない(格言にあるように、必要は発明の母である)。"
検閲の問題
しかし、他の人たちはDeepSeekの急成長について警告しており、中国で活動する新興企業として、国の法律やコンテンツ検閲の要件を遵守する必要があると主張しています。
ニュースメディアの一員として、私はもちろん言論と表現の自由を大切にしています。
しかし、OpenAIのモデルや製品(ChatGPTを含む)も同様に、さまざまな質問、特に人間のセクシュアリティやアダルト/NSFWコンテンツを扱う質問には、たとえそのような質問が一般的であったとしても、回答を拒否することを指摘しなければなりません。これらの質問はありふれたものです。
もちろん、これは完全な相互比較ではありません。海外の技術に頼ることへの抵抗感から、DeepSeekの最終的な価値や有用性に懐疑的な人もいるでしょう。しかし、その性能と低コストは否定できない。
米国が商品の16.5%を中国から輸入している時代において、検閲の懸念やセキュリティリスクだけを根拠にDeepSeek-R1の使用を警告するのは難しい。
DeepSeekをめぐる活発な議論からは、「西洋の衰退」と「中国の台頭」についての存立危機的な思考が感じられる。TikTokが一時的に禁止された際、米国のユーザーがXiaohongshuアプリに参加し、そこで共有される動画に映し出される中国の生活の質の高さに驚いたことと、このことをすでに関連付けている人もいる。-中国が台頭しているように見え(そして多くの指標でそう見えた)、アメリカが衰退しているように見えた(そして多くの指標でそう見えた)状況で。
世界を揺るがす中国のAIモデルは最初で、決して最後ではない
シリコンバレーの巨人の支配を脅かす中国のAIモデルも最後ではないだろう。
また、シリコンバレーの巨大企業の支配を脅かす最後の中国製AIモデルになることもないだろう。
つい昨日、TikTokの親会社であるByteDanceによる別の中国製モデル、Doubao-1.5-proがリリースされました。サードパーティのベンチマークにおけるその性能は、OpenAIの非推論ベースのGPT-4oモデルに匹敵するものでした。
中国のモデルは非常に速く、非常にうまく成長しているため、テック業界の外の人々でさえも注目しています。コメンテーターのマット・ブルーニッヒはXに投稿した:「私はNLRB文書の要約にGemini、ChatGPT、Claudeを1年近く使っている。チャットボット版は無料です。そのチャットボットのバージョンは無料であり、そのAPIを使用する価格はOpenAIのAPIよりも99.5%安い。[肩すかしの絵文字]"
OpenAIの反応は?
OpenAIの共同設立者でありCEOのSam Altmanが今日、まだリリースされていない第2世代の推論モデルファミリーであるo3をChatGPTに持ち込み、無料ユーザーでも利用できるようにすると述べたのも不思議ではありません。OpenAIは、より独自で先進的なモデルで独自の道を切り開き、業界標準を打ち立てているようです。
しかし、ディープシークやバイトダンス、その他の中国のAI企業が追随する中、OpenAIはいつまで最先端のAIモデルを作り、リリースし続けることができるのだろうか?そして、もし遅れをとった場合、その衰退はどれくらいのスピードで、どの程度悪化するのだろうか?
しかし、OpenAIには学ぶべきもう1つの歴史的先例がある。もし、DeepSeekや中国のAIモデルが、GoogleのオープンソースAndroidが、しばらくの間、市場の大部分を占めてきたモバイルのようなものだとしたら、AppleのiPhoneが、そのクローズドなプロプライエタリ・アプローチを通して、どのようにiPhoneのシェアを奪ってきたかを見る必要がある。
それにもかかわらず、大手研究所のAIモデルを使用するために大金を費やしているすべての人々にとって、DeepSeekは、同じ機能がより低価格で、より大きな制御で利用できる可能性があることを示唆している。企業環境においては、それだけで十分かもしれない。