中國 AI 公司 DeepSeek 近日聲稱,以不到 560 萬美元(約新台幣 1.84 億元)的成本成功訓練 AI 模型,該數據震撼科技界。然而,半導體與 AI 研究機構 SemiAnalysis 提出質疑,認為 DeepSeek 在硬體設備上的投入可能遠超 5 億美元(約新台幣 164.7 億元)。
據《CNBC》報導,DeepSeek 在其 AI 模型論文中已表明,所謂的「低成本」僅指訓練階段的直接支出,並未包含先前的研究、演算法開發、資料處理及消融(ablation)實驗等成本。SemiAnalysis 則指出,AI 模型的研發涉及龐大計算資源,而 DeepSeek 真正的支出應遠超官方公布的金額。
該機構進一步指出,全球 AI 公司在研發過程中往往需要大規模投資。例如,AI 新創公司 Anthropic 的 Claude 3.5 Sonnet 訓練成本達數千萬美元,但該公司從亞馬遜與 Google 募資數十億美元,以支付基礎設施建設、數據清理、模型優化及人力成本等開支。
此外,DeepSeek 在其論文中並未揭露訓練以外的投資金額,對於《CNBC》提出的相關詢問,該公司目前尚未回應。業界專家認為,AI 研發成本的計算方式存在不同標準,DeepSeek 所公布的數據可能僅反映部分開支,實際投入仍有待進一步釐清。