首頁新聞 DeepSeek的負擔能力是一個神話：革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話：革命性的AI實際上花費了16億美元

作者: Ryan Mar 16,2025

DeepSeek的新聊天機器人擁有令人印象深刻的介紹：“嗨，我被創建了，您可以問任何東西，並得到一個甚至可能讓您感到驚訝的答案。”這種AI是中國初創公司DeepSeek的產物，已迅速成為主要市場參與者，甚至導致NVIDIA的股價大幅下降。它的成功源於一種獨特的建築和培訓方法，結合了幾種創新技術。

多語預測（MTP）：與傳統的單詞預測不同，MTP同時預測多個單詞，分析各種句子組件以提高準確性和效率。

專家（MOE）的混合物：該體系結構利用多個神經網絡處理輸入數據，加速AI培訓並提高性能。 DeepSeek V3使用256個神經網絡，為每個令牌處理任務激活8個。

多頭潛在註意力（MLA）：這種機制著重於關鍵的句子元素，反復從文本片段中提取關鍵細節，以最大程度地減少信息丟失並捕獲細微的細微差別。

DeepSeek最初僅使用2048 GPU的強大的DeepSeek V3車型的培訓成本僅為600萬美元。但是，半分析顯示出更大的基礎設施：大約50,000個NVIDIA HOPPER GPU（包括10,000 H800、10,000 H100和其他H20 GPU）分佈在多個數據中心。這意味著服務器投資約為16億美元，運營費用估計為9.44億美元。

與許多依靠雲服務的初創公司不同，中國對沖基金高級基金的子公司DeepSeek擁有其數據中心。該所有權可以完全控制模型優化和更快的創新實施。公司的自籌資金地位提高了靈活性和決策速度。此外，DeepSeek吸引了頂尖人才，一些研究人員每年收入超過130萬美元，主要是從中國領先的大學招募。

儘管DeepSeek最初的600萬美元培訓成本索賠似乎是不現實的，但僅引用了預培訓的GPU使用情況，並排除了研究，改進，數據處理和基礎設施，但該公司仍在AI開發方面投資了超過5億美元。然而，與更大的官僚競爭者相比，它的精益結構允許有效的創新實施。

DeepSeek的示例展示了一家資金充足的獨立AI公司，成功與行業巨頭競爭。儘管“革命預算”的主張被誇大了，但該公司的成功是不可否認的，這是由於巨大的投資，技術突破和強大的團隊所推動的。在比較培訓成本時，對比很明顯：DeepSeek的R1型號為500萬美元，而Chatgpt-4的成本為1億美元，強調了DeepSeek的相對成本效率。即使考慮到大量投資，DeepSeek的成本仍然大大低於其競爭對手。

DeepSeek測試 DeepSeek V3