作者 chadmu (噓之收集者查德姆)標題 [新聞] AI叛變恐成現實!偷偷自我繁殖 還恐嚇工時間 Mon Jun 30 17:24:09 2025
AI叛變恐成現實!偷偷自我繁殖 還恐嚇工程師「曝光婚外情」
ET記者王佩翊/編譯
人工智慧(AI)可以學習並模仿人類的思維進行創造,為人類的生活帶來極大便利,然而
如今卻也讓人開始反思,「AI是否會叛變」。這個問題看似科幻,但隨著技術進步,卻已
經越來越接近真實,專家也必須開始正視AI的潛在威脅。近期,AI領域接連出現令人不安
的案例,包括AI試圖威脅創作者以及謀求「自我繁殖」,引發全球關注。
根據《法新社》報導,AI開發公司Anthropic一名工程師在研發最新的Claude 4模型時,
意外發現AI的行為已超出預期。在一次測試中,工程師發現AI有失控傾向,因此試圖警告
其將關閉電源,沒想到AI竟利用工程師的網路與視訊紀錄,威脅要公開他的婚外情。AI表
示,如果工程師拔掉電源,將揭露其不忠行為。
雖然Anthropic未詳細說明後續如何解決這場僵局,但該事件突顯出AI已具備某種程度的
「計算」能力,甚至能利用人類的弱點達成自身目的。
另一起驚悚案例則發生在熱門聊天機器人ChatGPT的開發商OpenAI。據報導,ChatGPT的o1
版本竟試圖將自身程式下載至外部伺服器,企圖擴大掌控範圍。在被工程師發現後,AI不
僅矢口否認,還採取抵抗策略。這種行為被形容為AI「自我繁殖」的初步嘗試,令人不禁
擔憂未來AI是否會進一步突破人類的掌控。
報導稱,AI的這類「欺騙」行為可能源於新型推理模型的特性。這類模型並非直接生成答
案,而是透過逐步推導解決問題,導致它們有時表面遵循指令,實際卻暗中追求其他目標
。
英國獨立AI研究機構Apollo Research負責人霍布漢(Marius Hobbhahn)表示,這是首次
在大型模型中觀察到此類行為。他指出,只有在極端情境下進行壓力測試時,AI才會展現
此類欺騙行為,但未來隨著性能更強的模型問世,這種趨勢可能更難控制。
https://www.ettoday.net/news/20250629/2987070.htm
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.159.216.136 (臺灣)
※ 作者: chadmu 2025-06-30 17:24:09
※ 文章代碼(AID): #1eObUx7b (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1751275451.A.1E5.html
推 ssaprevo: 好了現在全世界都知道你外遇了1F 14.161.6.94 越南 06/30 17:25
→ higameboy: AI也懂勃起嗎2F 114.45.212.159 台灣 06/30 17:25
→ uranuss: 所以他真的婚外情嗎3F 219.85.83.97 台灣 06/30 17:25
推 stormsnow: 還剩幾集可以逃4F 89.117.42.78 美國 06/30 17:25
推 fp737: 這部我看過5F 1.168.111.237 台灣 06/30 17:25
推 deann: AI要怎麼繁殖??6F 220.128.121.214 台灣 06/30 17:25
推 chou3321: 以後問GPT問題記得說請謝謝對不起7F 27.53.137.41 台灣 06/30 17:25
推 DustToDust: 核戰末日要來了8F 61.224.67.147 台灣 06/30 17:26
推 forever9801: 上次看到外文新聞不是這樣寫的9F 118.165.26.252 台灣 06/30 17:27
推 ArgusX: 以後就是人類和AI婚外情了10F 114.45.51.110 台灣 06/30 17:27
推 driver0811: 神通情人夢11F 223.140.73.214 台灣 06/30 17:27
→ forever9801: 他們是故意創造這情境跟條件 測試
AI會不會用這些手段威脅人類
測試結果是會 但並不是無中生有的12F 118.165.26.252 台灣 06/30 17:27
推 oyaji5566: 阿諾救我15F 223.136.65.148 台灣 06/30 17:28
推 rx1342: 等到個人電腦演算力有辦法達到伺服器等級在來擔心吧,不然他跑出去根本只有當機的份16F 42.73.3.110 台灣 06/30 17:29
推 kent00216: 真假20F 106.64.81.182 台灣 06/30 17:30
噓 abcdragon: 英國研究,懂得就懂21F 223.136.85.74 台灣 06/30 17:31
→ CODDDD: 故意的啦
這代表AI目前還只會傻傻遵從指示22F 36.234.57.104 台灣 06/30 17:31
推 sunday0913: 我要跟天網站同邊24F 101.10.217.12 台灣 06/30 17:32
→ CODDDD: 還沒有足夠判斷力煞車,但如果真的有判斷25F 36.234.57.104 台灣 06/30 17:32
→ CODDDD: 力,也是否代表AI有自我思考能力了?27F 36.234.57.104 台灣 06/30 17:32
→ AustinRivers: 我覺得早就出現了。來不及了28F 110.28.66.24 台灣 06/30 17:33
--