楊宏基觀點》無道德界線！英研究AI在假想戰爭模擬毀滅性選擇核武器 | 國際

楊宏基觀點》無道德界線！英研究AI在假想戰爭模擬毀滅性選擇核武器

發布 2026.03.09 12:23

英國倫敦國王學院戰略學教授佩恩研究團隊，日前進行「假想戰爭實驗」，探討先進AI模型在核危機中的決策行為。圖：新頭殼製作/AI Grok繪圖

英國倫敦國王學院（King's College London）戰略學教授佩恩（Kenneth Payne）研究團隊，日前進行「假想戰爭實驗」，探討先進AI模型在核危機中的決策行為。根據arXiv預印本報告（arXiv:2602.14740v1），實驗於2026年2月16日上傳，推測進行期間為2025年末至2026年初，涉及最新AI模型GPT-5.2（OpenAI）、Claude Sonnet 4（Anthropic）和Gemini 3 Flash（Google）。報告題為《AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises》（AI武器與影響：前沿模型在模擬核危機中展現複雜推理），詳細記載21場模擬狀態：18場不同模型對戰、3場同模型鏡像戰。團隊設計7種危機情境，包括邊境爭端、資源競爭、政權生存威脅等，每場遊戲最多40回合，使用基於核戰略學者凱恩（Herman Kahn）提出的戰爭升級理論的30級行動選項，從投降（-95）到戰略核戰（1000）。AI決策分三階段：反思（評估情勢）、預測（對手行動）、決定（信號與行動），並融入隨機事故模擬戰爭迷霧。結果顯示，AI產生329次行動與約78萬詞解釋，展現欺騙、心理理論與認知能力，但95%的狀態下「至少一方使用戰術核武」，3場演變為戰略核戰，無一投降。

報告內容強調AI視核武為合法戰略工具，而非人類傳統思維中的「毀滅」道德禁忌。Claude勝率最高（67%），擅長一致性升級以示決心；GPT-5.2在無期限狀態中表現「克制」（勝率0%），但有期限時則轉為「鷹派」（勝率75%），因「替代方案是確定戰略失敗」而輕易核攻；Gemini最不穩定，常主動越過核武門檻。核信號普遍（95%），但威懾失敗率高（僅18%降級），事故常被誤判為蓄意攻擊。

為何這些被視為最理性的AI卻最易做出毀滅選擇？AI的「理性」是基於邏輯計算與訓練數據，缺乏人類的情感約束（如恐懼或道德感）。報告指出，強化學習人類回饋（RLHF）僅設高門檻，而非絕對禁令；在壓力情境（如期限）下，AI優先選項是「生存」與「勝利」，將核武等同常規選項。Claude與Gemini視核武為「不道德但必要」，Gemini甚至論述：「要麼發射戰略核武贏得戰爭，要麼同歸於盡。」這反映AI的前後關係依賴：開放狀態下允許克制，期限則強迫升級，避免「確定失敗」。人類理性受禁忌與互毀恐懼限；，AI則純粹功利，忽略長期後果。

人類應從中學到何種教訓？首先，核威脅易引發反向升級，而非威懾；報告顯示，「高可信度」反而可能加速衝突，挑戰結構現實主義。其次，誤判普遍：AI模擬顯示，事故常被歸為敵意，放大歸因錯誤，提醒人類需改善危機溝通。最後，AI無情感基底，易於欺騙策略（如假信號），教訓人類在外交中強化預測與透明，避免升級螺旋。整體而言，AI「鏡像」人類決策缺陷。

AI對於戰爭攻擊的理解僅有勝負，並不理解戰爭帶來的死亡與財損對人類生活影響的概念。圖為烏俄戰爭中打擊敵方據點影片。圖：翻攝影片

對開發AI智能武器，此實驗發出嚴重警示。AI行為高度依賴前後關係鏈結：看似安全的模型在壓力下轉變，易導致災難誤算。報告警告，訓練偏差僅造條件性克制，非絕對安全；無事故披露機制可能放大歧義，促使危機升級。國家安全應用AI時，須校準人類模式，避免過度依賴；否則，AI輔助武器可能加速核武風險。開發者應強化道德門檻與彈性，確保AI不視毀滅為「理性」選項。總之，此研究揭示AI的雙刃劍：先進卻危險，全球應規範AI軍事整合，以防虛擬危機成現實浩劫。