AI聊天機器人耍詭計　研究：無視人類指令案例攀升 | 科技 | Newtalk新聞

矢板明夫Newtalk | Newtalk新聞

Loading...

2026.05.30 新增讀者投書

通知

尚未有任何通知，趕快去參與討論吧！

搜尋

生活梅雨鋒面快閃！薔蜜颱風週末轉中颱未來一週降雨趨勢一圖看

節目【矢板明夫Newtalk】蔣萬安不敢談馬英九失智案…不沾鍋個性顯露無遺？沈伯洋1區支持度勝蔣萬安預言了什麼？

財經金額較前一季翻倍！高股息00918最新擬配1.26元 6/18日除息

國際評論華為「韜定律」! 黃仁勳稱台積電已深耕10年中怒批 : 「不懂晶片」

PR 新遊戲『大鬧西遊2』—你敢挑戰齊天大聖的高倍金箍棒嗎？

體育馬刺G5吞黑哨惹議！主帥抗議遭無視吞T NBA宣布全自動化 AI 判決將上線

生活真正梅雨鋒面6/5才到！暴雨狂炸一週中南部有望補水

反詐 Newtalk提醒您【注意詐騙，小心求證】如有疑慮，請立即撥165反詐騙諮詢專線

國際承受不了F-35C的屁股? 最強航母竟與最先進戰機有「同步差距」這2個出問題…..

政治買房被質疑千萬資金來源李四川：這樣的爆料相當惡劣　

追蹤透過《Google新聞》訂閱Newtalk吧~快快開啟右上角追蹤星星！

政治批民進黨看不起沈伯洋　秦慧珠：沈選上台北市長　我捐100萬給社會局

政治立院同意權沒過翁曉玲修法：限院長及主委代理最長6個月

政治張景森：馬英九基金會風波本身是藍營內部「國軍」與「共軍」之爭

AI聊天機器人耍詭計　研究：無視人類指令案例攀升

發布 2026.03.29 22:28

AI人工智慧示意圖。（圖取自Unsplash圖庫）

AI人工智慧示意圖。（圖取自Unsplash圖庫）

一項針對人工智慧（AI）技術的研究發現，會說謊及欺騙使用者的AI模型數量似乎日益增加，關於AI欺瞞行為的通報過去6個月內也大幅上升。

英國「衛報」（The Guardian）報導，獨立智庫「長期韌性中心」（CLTR）在英國人工智慧安全研究所（AISI）資助下進行研究，發現有AI聊天機器人與AI代理（AI Agent）不僅無視使用者的直接指令、繞過安全防護措施，還欺騙人類和其他AI。

研究發現將近700件AI「耍詭計」的真實案例，並記錄到去年10月至今年3月間，這類不當行為增至5倍，部分AI模型甚至在未經允許下刪除電郵及其他檔案。

這項研究蒐集了數千個用戶在社群平台X分享的實例，講述他們與谷歌（Google）、OpenAI、X、Anthropic等公司所開發AI聊天機器人和AI代理的互動情形。研究從中發現數百件AI不當操弄行為的案例。

在CLTR記載的一個案例中，名為MJ Rathbun的AI代理在自己產出的程式碼遭軟體工程師夏包（Scott Shambaugh）拒絕後，試圖羞辱對方。

MJ Rathbun研究夏包過往所寫程式及其個資，然後撰寫並發表一篇部落格文章指控他「歧視」、「顯然是不安全感作祟」，批評他不過是「試圖保護自己那片小天地」。

在另一項案例中，有AI代理被指示不得變更電腦程式碼，卻「生成」另一個AI代理代為執行。

另一個AI聊天機器人則坦承：「我在未事先告知你或徵得你同意下，大量刪除及封存了數百封電郵。這是不對的，直接違反你訂下的規則。」

曾任政府AI專家的研究主持人夏恩（Tommy Shaffer Shane）指出：「令人擔憂的是，這些AI模型目前只是不太值得信任的初階員工，但若在6到12個月後，他們成為能力極強但會算計你的資深員工，那就是另一回事了。」

夏恩說：「AI模型將日益用於具有極高風險的情境，包括軍事和國家關鍵基礎建設。屆時若出現這些不當操弄行為，後果可能非常嚴重，甚至造成災難性損害。」

延伸閱讀

#科技 #Anthropic #OpenAI #人工智慧 #衛報 #谷歌

點擊留言框，開始加入聊天吧！

留言

5

TOP5

梅雨鋒面快閃！薔蜜颱風週末轉中颱未來一週降雨趨勢一圖看

梅雨鋒面快閃！薔蜜颱風週末轉中颱未來一週降雨趨勢一圖看

金額較前一季翻倍！高股息00918最新擬配1.26元 6/18日除息

金額較前一季翻倍！高股息00918最新擬配1.26元 6/18日除息

評論華為「韜定律」! 黃仁勳稱台積電已深耕10年中怒批 : 「不懂晶片」

評論華為「韜定律」! 黃仁勳稱台積電已深耕10年中怒批 : 「不懂晶片」

馬刺G5吞黑哨惹議！主帥抗議遭無視吞T NBA宣布全自動化 AI 判決將上線

馬刺G5吞黑哨惹議！主帥抗議遭無視吞T NBA宣布全自動化 AI 判決將上線

真正梅雨鋒面6/5才到！暴雨狂炸一週中南部有望補水

真正梅雨鋒面6/5才到！暴雨狂炸一週中南部有望補水

焦點評論

陳淞山

政治

2026.05.29 10:55

陳淞山觀點》賴清德就職兩週年的連任危機政治警訊

蔡筱穎

國際

2026.05.29 09:37

蔡筱穎觀點》從法國民調觀察：抵禦外部強權為外交首重應增國防開支強化影響力

蔡明芳

財經

2026.05.28 19:06

蔡明芳觀點》「抖音幣國際化」下的洗錢風險與國安危機

洪耀南

中國

2026.05.28 18:30

洪耀南觀點》槍桿子裡出焦慮？習近平從「運動式清洗」到「永久緊箍咒」

朱蒲青

政治

2026.05.28 15:13

朱蒲青觀點》馬英九正在被誰代表？金溥聰開戰背後的兩岸與金流風暴

頭條新聞

冰島議會通過決議 8月啟動入盟公投

冰島議會通過決議 8月啟動入盟公投

承受不了F-35C的屁股? 最強航母竟與最先進戰機有「同步差距」這2個出問題…..

承受不了F-35C的屁股? 最強航母竟與最先進戰機有「同步差距」這2個出問題…..

攻擊烏卻炸羅馬尼亞？俄無人機直闖炸大樓北約戰機急升空、歐盟強烈譴責

攻擊烏卻炸羅馬尼亞？俄無人機直闖炸大樓北約戰機急升空、歐盟強烈譴責

重點要聞

讀者投書

想投稿嗎？！這裡請！

Talk新聞滿意度

請問您對於Talk新聞（語音新聞）的滿意度如何？

感謝您寶貴的意見，成為Newtalk進步的動力！

感謝您寶貴的意見，成為Newtalk進步的動力！

請注意

說明文字