近日DeepSeek嘗試採用華為Ascend晶片訓練R2模型的計畫以失敗收場,最終不得不回頭依賴Nvidia GPU,讓外界一片嘩然。這場原本被寄予厚望的「國貨優先」實驗,卻因性能不穩、軟體工具不成熟而導致悲慘結局,鮮明揭示了中國在「必須用國貨」政策氛圍下,AI自主化之路所面臨的巨大挑戰。
DeepSeek的困境,說穿了就是「愛國有餘,技術不足」。華為Ascend雖在規格上號稱高效能,但實際應用中卻暴露出互連頻寬不足、訓練穩定性低,以及CANN軟體框架不成熟等問題。相比之下,Nvidia的CUDA生態經過二十年打磨,提供強大的開發者工具與優化庫,形成難以撼動的軟體優勢。結果顯示,中國晶片的硬體追趕無法彌補生態落差,這正是國貨情懷與現實需求之間的矛盾。
在美國嚴格限制高端晶片出口的情況下,中國企業面臨「要嘛用國貨、要嘛停擺」的選擇。DeepSeek因政策期待被迫嘗試國產晶片,卻最終失敗,轉而採取「訓練用Nvidia、推理用華為」的折衷策略。這不僅突顯了技術短板,也凸顯中國AI產業在政策與市場之間的兩難:若繼續依賴Nvidia,就違背自主化政策;若全盤國產化,則技術競爭力不足,難以跟上全球步伐。
DeepSeek的失敗雖是挫折,但也提供了反思契機。中國若要真正擺脫依賴,必須投入龐大資源建設軟體生態,否則硬體再怎麼堆規格都難以支撐大規模AI訓練。演算法與資源效率的創新,或許能成為突破瓶頸的路徑,例如DeepSeek過去在R1模型中利用混合專家(MoE)、知識蒸餾的嘗試,顯示在有限條件下仍有創新空間。更重要的是,技術自主不是單一企業的戰鬥,而需要整個產業鏈從設計、製造到軟體協作的全面協同。
這場國貨至上卻遭遇現實困境的挫敗,並非單一企業的失誤,而是制度與技術之間碰撞的必然結果。光靠口號和政策壓力,無法替代長期積累的技術生態。對台灣而言,這同樣是一個警示:在全球AI競賽中,既要加速本土研發,也要維持與國際生態的連結,避免陷入閉門造車的困境。
楊聰榮(新東向產業聯盟理事/中台灣教授協會理事長/任教於台灣師範大學)
(文章僅代表作者觀點,不代表Newtalk新聞立場。)