NVIDIA近日發表 NVIDIA Alpamayo 系列開放人工智慧(AI)模型、模擬工具與資料集,旨在加速推動實現安全且基於推理的自駕車(AV)開發新紀元。

以下是重點摘要內容:

全站首選:選縣長遭國民黨縣黨部封殺!何啟聖:坐實傅崑萁家族把持壟斷花蓮

NVIDIA 率先推出開放式推理視覺語言動作模型,專為解決自動駕駛的「長尾」挑戰而設計;NVIDIA Alpamayo 系列同時也涵蓋自動駕駛開發所需的模擬工具與資料集。

Alpamayo 1、AlpaSim 及物理 AI 開放資料集,協助開發具備類人判斷力的車輛,使其能夠進行感知、推理與行動,並讓開發者得以微調、蒸餾和測試模型,進而實現更高的安全性、穩健性與擴充性。

藉由 Alpamayo,JLR、Lucid 與 Uber 等移動服務領導者,以及包括 Berkeley DeepDrive 在內的自駕研究社群,能加速推動安全且基於推理的 Level 4 自動駕駛部署藍圖。

當前熱搜:謝步智觀點》美軍若侵格陵蘭 北約就此滅亡! 川普有「這4種」併吞方式

以下是完整內容:

自駕車必須在極其廣泛的駕駛條件下安全運行。罕見且複雜的場景,通常被稱為「長尾(long tail)」,依然是自動駕駛系統安全掌控的最大挑戰之一。傳統的自動駕駛架構將「感知」與「規劃」分離,導致在面對新型或異常狀況時使系統的擴充性受限。雖然端到端學習近期已取得重大進展,但要克服這些長尾邊緣案例,模型必須要能夠針對因果關係進行安全推理,尤其是在狀況超出模型訓練經驗時。

Alpamayo 系列推出具備思維鏈且基於推理的視覺語言動作(VLA)模型,將類人思維導入自動駕駛的決策過程。這些系統能逐步解析新穎或罕見的場景,提高對於升級智慧車輛信任度與安全性至關重要的駕駛能力與可解釋性,並由 NVIDIA Halos 安全系統提供技術支持。

NVIDIA 創辦人暨執行長黃仁勳表示:「物理 AI 的 ChatGPT 時刻已經到來,機器開始在現實世界中理解、推理並採取行動。自駕計程車將是首批受益者之一。Alpamayo 為自駕車帶來推理能力,使其得以思考罕見場景、在複雜環境中安全駕駛,並解釋駕駛決策。這正是實現安全、可擴展自動駕駛的基石。」

基於推理之自動駕駛的完整開放生態系
Alpamayo 將三大支柱,包括開放模型、模擬框架與資料集,整合進一個緊密相連的開放生態系,任何汽車開發者或研究團隊皆可在此基礎上進行建構。

Alpamayo 模型並非直接在車內運行,而是作為大規模的教師模型(teacher model),讓開發者可以對其進行微調與蒸餾,進而成為完整自動駕駛技術堆疊的核心骨幹。

在 CES 大會上,NVIDIA 發佈:

Alpamayo 1業界首款為自駕研究社群設計的思維鏈推理視覺語言動作模型,現已於 Hugging Face 上架。憑藉百億參數架構,Alpamayo 1 能透過影片輸入產生行進軌跡與推理軌跡,展現每個決策背後的邏輯。開發者可將 Alpamayo 1 改造成運行時間較短的模型用於車輛開發,或將其作為基於推理的評估器和自動標註系統等自動駕駛開發工具的基礎。Alpamayo 1 提供開放的模型權重與開源推理指令碼。該系列未來的模型將具備更大的參數規模、更精細的推理能力、更靈活的輸入輸出選項,以及更多商業化用途。

AlpaSim一款完全開源的端對端的模擬框架,用於高擬真度自動駕駛開發,現可於 GitHub 取得。AlpaSim 提供逼真的感測器建模、可配置的交通動態,以及具擴展性的閉環測試環境,從而實現快速驗證與策略最佳化。

物理 AI 開放資料集:NVIDIA 提供最豐富多元的大規模自駕開放資料集,其中包含超過 1,700 小時的駕駛資料,涵蓋最廣泛的地理區域與環境條件,並囊括對於提升推理架構至關重要的罕見複雜真實世界邊緣案例。這些資料集已在 Hugging Face 上架。