Deepseekの手頃な価格は神話です。革新的なAIは実際には16億ドルの費用がかかります。

著者: Ryan Mar 16,2025

Deepseekの新しいチャットボットには、印象的な紹介があります。中国のスタートアップDeepseekの製品であるこのAIは、すぐに主要なマーケットプレーヤーになり、Nvidiaの株価の大幅な低下に貢献しています。その成功は、いくつかの革新的な技術を組み込んだユニークなアーキテクチャとトレーニング方法に由来しています。

マルチトークン予測(MTP):従来の単語ごとの予測とは異なり、MTPは複数の単語を同時に予測し、さまざまな文コンポーネントを精度と効率の向上について分析します。

専門家の混合(MOE):このアーキテクチャは、複数のニューラルネットワークを活用して入力データを処理し、AIトレーニングの加速とパフォーマンスを高めます。 Deepseek V3は256個のニューラルネットワークを利用して、トークン処理タスクごとに8個をアクティブにします。

マルチヘッド潜在的注意(MLA):このメカニズムは、重要な文化要素に焦点を当てており、テキストフラグメントから重要な詳細を繰り返し抽出して、情報の損失を最小限に抑え、微妙なニュアンスをキャプチャします。

Deepseekは当初、2048 GPUを使用した強力なDeepSeek V3モデルに対して、わずか600万ドルのトレーニングコストが非常に低いと主張しました。ただし、セミアン症により、はるかに重要なインフラストラクチャが明らかになりました。約50,000個のNVIDIAホッパーGPU(10,000 H800、10,000 H100、および追加のH20 GPUを含む)が複数のデータセンターに広がっています。これは、サーバー投資が約16億ドルで、運用費用は9億4,400万ドルと推定されます。

中国のヘッジファンドハイフライヤーの子会社であるDeepseekは、クラウドサービスに依存している多くのスタートアップとは異なり、データセンターを所有しています。この所有権は、モデルの最適化とより高速なイノベーションの実装を完全に制御します。同社の自己資金によるステータスは、柔軟性と意思決定速度を向上させます。さらに、Deepseekはトップの才能を引き付け、一部の研究者は年間130万ドル以上を稼ぎ、主に中国の大学から募集しています。

DeepSeekの最初の600万ドルのトレーニングコスト請求は非現実的であるように見えますが、GPUの使用前にのみを参照し、調査、改良、データ処理、インフラストラクチャを除外していますが、同社はAI開発に5億ドル以上を投資しています。ただし、その無駄のない構造は、より大きく、より官僚的な競合他社と比較して、効率的なイノベーションの実装を可能にします。

Deepseekの例は、資金提供された独立したAI会社を紹介しています。 「革新的な予算」の請求は誇張されていますが、会社の成功は否定できず、多大な投資、技術的なブレークスルー、強力なチームに支えられています。トレーニングコストを比較するとコントラストが厳しくなります。DeepSeekのR1モデルの価格は500万ドル、ChatGPT-4は報告された1億ドルのコストで、DeepSeekの相対的なコスト効率を強調しています。多額の投資を考慮しても、DeepSeekのコストは競合他社よりも大幅に低いままです。

DeepSeekテストDeepseek V3deepseekdeepseek