繼今年一月 DeepSeek 的問世震撼市場後,中國人工智能新創企業「智譜 AI」(Zhipu AI, Z.ai)週一(28日)正式推出其新一代開源基礎模型「GLM—4.5」,將與 OpenAI、Anthropic 等目前領先全球的生成式 AI 公司來競爭。

據中國媒體《力報》指出,GLM—4.5 模型是專門為智能體(AI agents)應用場景設計,其具備強大推理、編碼與多工具協力作業能力,並同步以美國的「Hugging Face」 、「ModelScope」等 AI 模型為基礎來開源;並採用了混合專家(Mixture of Experts)架構,具備「思考」與「非思考」兩種推理模式,可針對不同應用場景調整,既能進行複雜邏輯與工具調用,也可高速應答。

精選報導:大罷免出師不利!陳昇現身:習大大給一億都不去中國

 

美媒《CNBC》指出,GLM—4.5 模型的使用成本將低於 DeepSeek,但尚未透露花了多少錢訓練。此外,其與現有 AI 模型的底層邏輯不同,是以所謂的「代理 AI」為基礎,這意味著該模型會自動將任務分割成各種子任務,以便更能精準地完成像是工具使用、網頁瀏覽、軟體工程、前端程式設計等任務。且新模型也是開源的,所有開發人員都可以免費下載和使用。

 

目前,在中國獲得美國政府允許解禁進口輝達(NVIDIA)「H20」晶片之際,市場關注的是,這款模型會使用多少晶片?智譜執行長張鵬向《CNBC》聲稱,GLM—4.5 只需要 8個「H20」晶片即將投入營運,且大小僅 DeepSeek 模型的一半。張勇表示,公司目前擁有足夠的運算能力,不需要購買更多晶片。

號稱能媲美美國 OpenAI 的「ChatGPT」,DeepSeek 聲稱,其「V3」模型的訓練成本不到 600萬美元;不過,一些分析師表示,該數字是基於該公司長期以來超過 5億美元的硬體支出得出的。

 

收費方面,智譜表示,這款新的 GLM—4.5 模型輸入每一百萬字碼(token)將收 11 美分,而 DeepSeek R1 是 14 美分;而每百萬輸出字碼將收費 28 美分,DeepSeek 則是收費 2.19 美元。無論輸入還輸出,均比 DeepSeek 還便宜。

受惠晶片需求的輝達週一收在 176.75美元,漲幅 1.87%。