中国発AIへの評価を一変させた、コスト効率の高さ
2022年末にOpenAIのChatGPTが登場して以降、生成AIの競争が一気に加速しました。中国国内でも百度(Baidu)など大手企業が独自のチャットボットを開発しましたが、当初は先行する欧米のモデルに太刀打ちできるものではありませんでした。
しかし2024年末にDeepSeekが登場すると、この評価が一変します。DeepSeekはまず2024年11月に推論特化版の予備モデルを発表し、12月に汎用モデルDeepSeek-V3、そして年明け1月には先進的な推論モデルDeepSeek-R1と、立て続けにリリースをしました。
🚀 DeepSeek-R1 is here!
⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!
🐋 1/n pic.twitter.com/7BlpWAPu6y
— DeepSeek (@deepseek_ai) 2025年1月20日
DeepSeek-V3はMoE(※1) と呼ばれるアーキテクチャを採用し、モデルのパラメータ数は実に6710億にも達します。また、一度に処理できる文脈の長さ(コンテキスト長)も最大128,000トークンと十分に大きく、OpenAI社のGPT-4oなど従来の各社フラッグシップモデルと並びます。
※1 Mixture-of-Expertsの略。複数の専門的なニューラルネットワーク(エキスパート)を組み合わせて、タスクに応じて最適なエキスパートを選択するアーキテクチャ。各エキスパートが特定の入力パターンや問題領域に特化することで、全体として効率的で高性能なモデルを実現する。
DeepSeek-V3は、わずか2カ月の期間と600万ドル以下の計算コストとで訓練できたとされており、数億ドル単位の投資が当たり前だった従来のLLM(大規模言語モデル)開発と一線を画すコスト効率と言えます。
中国のスタートアップが桁違いとも言える低コストで欧米の最先端モデルに匹敵するAIを作り上げた、というニュースは、中国国内のみならずシリコンバレーの技術者や経営者からも称賛を浴び、瞬く間に世界的な話題となりました。
実際、DeepSeekのAIアシスタントアプリ(DeepSeek-AI)は米国App Storeの無料アプリランキングでOpenAIのChatGPTアプリを抑えて1位を獲得し、一般ユーザーからの注目度も一気に高まっています。わずか創業半年ほどの無名だった中国企業が、AI分野で一躍トップクラスの存在感を示したのです。
DeepSeek-V3とR1の革新性はどこにある?
また、DeepSeek-V3の発表から間をおかず発表されたDeepSeek-R1は、推論時にCoT(※2)を行い、回答に至るまでの「考えた過程」を内部で保持します。これにより複雑な問題解決や論理的な質問に対しても、一段階ずつ理由付けしながら回答を導き出すことができます。
※2 Chain-of-Thoughtの略。AIが問題解決や推論を行う際に、人間のように段階的に思考を積み重ねていく手法。最終的な回答だけでなく、そこに至るまでの思考プロセスも含めて生成することで、より論理的で説明可能な推論を実現する。
同様の能力はOpenAI社においてはGPT-o1など実験的なモデルで実現されていましたが、DeepSeek社はそのGPT-o1に並んだと主張しています。GPT-o1では、その学習には大量の人手による微調整が用いられてきたと言われていますが、DeepSeek-R1では強化学習(※3)を大規模に活用し、人手による微調整なしでベースモデルに直接強化学習を適用しました。
※3 AIが試行錯誤を通じて最適な行動を学習する手法。行動に対する報酬(または罰)を基に、より良い結果を得られる行動パターンを自律的に獲得する。人間が正解を教える必要がない点が特徴。
その結果、強化学習の過程でモデル自身が複雑な推論パターンを自発的に獲得する創発的な挙動が観察され、モデル性能の飛躍的向上につながったと報告されています。これらの技術的工夫により、DeepSeek-R1は高度なCoTによる推論モデルを、短期間・低コストで実現したとしています。
「巨額の費用を投じた従来モデルに負けないAIを、効率的な仕組みで安く提供する」という点で、DeepSeek-V3とR1は革新的な存在と言えるでしょう。
数百兆円規模の市場価値を動かした衝撃度
さて、こうしたDeepSeek旋風が起きているのは、技術的インパクトだけでなく地政学的・経済的な要因も大きいと言えます。
1月下旬にDeepSeek-R1が公開されると、米国の株式市場ではAI関連銘柄が急落しました。NASDAQ総合指数が約3.4%下落し、AI半導体の雄・NVIDIAの株価は取引開始直後に17%も急落したとの報道もあります。一企業のAIモデル公開が、わずか数日で数百兆円規模の市場価値を動かしたのですから、その衝撃度がうかがえるでしょう。
なぜ市場がこれほど敏感に反応したかといえば、DeepSeekの成功が「ゲームチェンジャー」となり得ると捉えられたからです。
従来、最先端のAIを開発・提供できるのは巨額の資金と最高性能の米国製チップを持つ一部企業(OpenAIやGoogle、Metaなど)に限られていました。しかしDeepSeekは、米国からの先端GPU輸出規制下にある中国で、市販の限られた計算資源だけで最高水準のモデルを作り上げました。この事実は「莫大な投資をしなくてもAIで世界のトップに立てる」可能性を示したのです。
この可能性は世界中に大きな衝撃を与えました。米国ではOpenAIやその出資元のMicrosoftが、DeepSeekが自社モデルの出力データを無断利用したのではないかとの調査に乗り出したとも報じられました。
一方で、プライバシーやセキュリティへの懸念から、イタリア、インド、韓国、オーストラリア、台湾などの政府機関、NASAや米海軍などがDeepSeekの公式サービスの使用を禁止する動きも出ています。
技術ポートフォリオ分散もビジネス上重要に
先行陣も黙って見ているわけではありません。OpenAIはDeepSeek-R1公開からわずか10日後の2025年1月末に、対抗する推論モデルGPT-o3を無料で公開する動きを見せました。
Free users can now try OpenAI o3-mini in ChatGPT by selecting the Reason button under the message composer. https://t.co/Ws5rXqnKep pic.twitter.com/vT2snEUbzH
— OpenAI (@OpenAI) 2025年1月31日
このモデルはオープンソースではないものの、強力な推論能力を安価に提供しようという試みで、DeepSeekに対抗する姿勢がうかがえます。
競争はイノベーションを加速させるため、様々なモデルの中から自社に最適なものを選べるようになるのは利用者にとっては良いことです。DeepSeekを含む中国発モデルと、OpenAI、Anthropicなど欧米発モデルの双方を視野に入れ、技術ポートフォリオを分散させておくこともビジネス上重要になるでしょう。
いずれにせよ、DeepSeekが引き金となったAI業界の競争激化は、利用者に対しても「AI戦略を再考せよ」というメッセージを投げかけています。
このように「中国発の最先端AI」としてDeepSeekが放つインパクトは技術面だけに留まらず、経済・政治を巻き込んだ社会現象となっているため、現在大きな話題となっているのです。
次回は、広告・マーケティングの仕事に従事されている読者の皆さんが気になるであろうDeepSeek利用のメリット、デメリットについてお伝えできればと思います。
