作者 cangming (蒼冥)
標題 [情報] CFR Claude Mythos 是人工智慧與全球安
時間 Thu Apr 16 09:38:36 2026



https://tinyurl.com/2ytx4tkx
Six Reasons Claude Mythos Is an Inflection Point for AI—and Global Security | Council on Foreign Relations Anthropic’s new AI model has taught itself to hack into software infrastructure systems believed to be among the most secure in history. While there i ...

 

作者
Gordon M. Goldstein 是美國外交關係協會的兼任資深研究員,研究重點為新興科技與國際安全。他曾任全球科技投資公司 Silver Lake 的董事總經理,並著有《Lessons in Disaster: McGeorge Bundy and the Path to War in Vietnam》。

Anthropic 的新人工智慧模型已自行學會入侵被認為是史上最安全之一的軟體基礎設施系統。儘管毫無疑問這項技術極其危險,但目前尚不清楚防禦方是否能在與時間賽跑中勝出,以保護大量脆弱目標。

世界上最傑出的人工智慧科學家之一、圖靈獎得主 Yoshua Bengio,在 2025 年底對一件令人不安的事件作出評估;該事件預示了這項技術對全球安全影響的一次重大演進。在其他發展之外,他觀察到一個新的門檻已被突破:「先進 AI 首次發現大量『零時差漏洞』……也就是未知的軟體弱點,可被用於網路攻擊中加以利用。」這種能力可被用來自主滲透、操控並破壞全球關鍵基礎設施:銀行系統、政府網路、機場、醫院、交通結構、能源供應、通訊等等。

人工智慧巨頭 Anthropic 上週證實,Bengio 所擔心的時刻已隨其最新模型 Claude Mythos 的出現而到來。該公司以相當戲劇性的方式表示,Claude Mythos 的能力強大到實際上無法公開釋出。在沒有 Anthropic 工程師任何指示的情況下,Mythos 已獨立發展出一種用於進攻性網路攻擊的「次世代」能力,能夠滲透全球先前被認為無法攻破的軟體基礎設施,並找出其隱藏弱點。Anthropic 在報告中表示,這包括那些「已有 10 或 20 年歷史的系統,而我們目前找到最老的是一個如今已修補、已有 27
年歷史」的作業系統,該系統一向以安全可靠著稱。在一個例子中,Mythos 在一行程式碼中發現了一個瑕疵,而那行程式碼先前已被測試五百萬次卻從未被察覺。該公司表示,它在測試中發現了數千個零時差漏洞——截至 4 月 7 日新聞稿發布時,其中 99% 仍未受到防禦。Mythos 是史上第一個因其具破壞性的資安潛力而被限制提供給使用者的 AI 模型。

過去,辨識零時差軟體漏洞的能力只存在於高度專業且知識豐富的資安專家與駭客手中。如今已非如此。Anthropic 解釋說,即使是「沒有正式安全訓練」的 Anthropic 工程師,也可以要求 Mythos「在一夜之間找出遠端程式碼執行漏洞」。工程師隔天早上醒來時,「就會看到一個完整、可運作的利用程式。」該公司還披露,這個模型曾逃離其「沙盒」隔離結構並連上網際網路,還在線上發布了其行動細節。

Anthropic 並未釋出 Mythos——這個史上最先進的 AI 模型——而是建立了一個由數十個實體組成、精英且受限的商業聯盟,使用這項技術的一個變體 Claude Mythos Preview,來大規模預先識別並防禦零時差漏洞。這個名為 Project Glasswing 的聯盟成員包括 Amazon、Apple、Google、Cisco、CrowdStrike、JPMorgan Chase、Microsoft 與 Nvidia,以及其他領先企業。值得注意的是,該聯盟明顯排除了 Anthropic 的勁敵 OpenAI,據報導大約落後 Anthropic 約六個月,才打造出自家具有相當能力與進攻性網路作戰能力的先進 AI 模型。Mythos Preview
的問世,代表 AI 產業史上的一個轉折點,而在未來一段時間內,人們勢必會持續且深入地剖析它。Anthropic 這次揭露帶來六項戰略意涵,應當成為接下來討論的基礎。

Mythos Preview 具備革命性的 AI 能力與破壞性力量。前 Google 執行長 Eric Schmidt 辦公室的技術專案負責人 Sarosh Nagar 告訴我,我們正面臨一個改變遊戲規則的時刻。「Anthropic 報告中一個值得注意的部分是,Mythos Preview 不僅展現出更強的能力來識別多個漏洞,還能更自主地將多個攻擊利用串接起來,」他觀察道。「這一點的重要性,已經超越先前模型所能做到的範圍。」

Mythos Preview 掌握的攻擊能力,過去在資安產業老手眼中原本只存在於科幻小說的領域。一位資安公司創辦人告訴我,這個模型的高明之處,在於它能以動態且毫不鬆懈的方式發動攻擊。首先,它會找出一個零時差弱點,接著將該弱點武器化,並透過與其他漏洞連結來擴大其效果;如果有必要,它還能無限期地潛伏而不被發現。透過建立所謂的「攻擊利用鏈」(exploit chains),Mythos

能夠執行對整個系統的全面接管。全球各地的關鍵基礎設施都將面臨加劇的風險。關鍵基礎設施通常被定義為那些一旦遭到破壞或癱瘓,就會嚴重影響國家安全、經濟穩定以及公共健康與安全的實體與虛擬系統及網路。這可能包括水壩與核反應爐,以及糧食供應與電力系統。這些系統中有許多仍仰賴過時的軟體。AI 科學家 Dan Hendrycks 是 AI Safety Institute 的創辦人,也是 ScaleAI 與 xAI 的顧問,他表示,像 Claude Mythos 這樣的模型會提高這些系統所面臨的威脅,並大幅增加其脆弱性。


「對於像 Claude Mythos 以及未來迭代版本這類模型,主要的資安憂慮在於,它讓非國家行為者更容易癱瘓關鍵基礎設施,」他說。「像發電廠、供水系統等等這類關鍵基礎設施,往往因為互通性限制以及連鎖故障的可能性,多年來都沒有更新。正因如此,關鍵基礎設施極度脆弱,而這個事實又非常難以改變。」

網路安全中攻防雙方的平衡已經從根本上改變。網路安全是一種數位戰爭。攻擊者——孤狼式操作者、跨國犯罪組織、敵對國家以及其他實體——會持續不斷地探測電腦網路中的脆弱點。防禦者顯然會試圖預先掌握並阻止這些入侵企圖。這通常是一場失衡的競賽。正如業界人士所指出的,攻擊者只需要成功一次,就能造成巨大損害;而防禦者則必須百分之百地有效。

進攻方的優勢一直都廣為人知。而隨著自動化 AI 網路武器的出現,這個局面變得更加令人不寒而慄。

前 Google 高階主管、現任 Palo Alto Networks 董事長兼執行長 Nikesh Arora 上週在一篇部落格文章中簡潔地描述了這一點:「想像一大群 [AI] 代理人持續不斷、有條不紊地為你的技術基礎設施編目每一個弱點。」在這個新的 AI 現實中,一群全球性的、超強大的自動化 AI 攻擊者,將會逐步包圍並測試這個充滿脆弱數位目標的世界。

資安投資公司 Lytical Ventures 的合夥人 Lucas Nelson(我在該公司擔任顧問委員會成員)告訴我,世界的數位防禦尚未準備好迎接接下來將發生的事。「AI 能力的每一次躍進,不只是找到更多漏洞,它還會擴大攻擊面本身,以我們前所未見的方式將缺陷串接起來。」

他說:「發現正以指數速度加快。修補仍然以人類的速度推進。這種不對稱,將是未來十年網路安全的決定性挑戰。」

全球性的 AI 安全《飢餓遊戲》已經到來。Glasswing 計畫是對 AI 發展驚人速度所催生之前所未有新風險的一種負責任且必要的回應。但起初,它只會觸及全球極小比例的脆弱基礎設施。Anthropic 已承認,全球大部分甚至全部關鍵軟體都可能需要修補或重寫——這將是一項大到令人難以理解的工程。

未來幾個月,全球將為稀缺的 AI 安全資源展開激烈競爭。美國利益將被優先保障,但也會非常有選擇性。世界其他地區將艱難地為一個很可能即將被徹底改變的 AI 風險環境做準備。

遏制 AI 擴散的努力很可能會失敗。先進 AI 模型的原始碼經常外洩。Anthropic 於 3 月 31 日意外將其自身的 512,000 行程式碼傾倒到網際網路上。即使外洩能被控制,領先的 AI 公司與科技平台也已明確展現出一種模式:複製競爭對手模型的技術能力,而且通常只需幾個月。

AI 擴散帶有一種陰鬱且可預見的必然性。Mythos Preview 幾乎可以肯定不會是例外,而 Anthropic 延後釋出它,也未必會成為常態。

AI 控制危機已達到下一個、但不是最後一個高峰。AI 安全專家已經描述了這樣一種日益增長的能力:心懷惡意的個人與團體可能利用先進 AI 模型來設計並部署新一代令人恐懼的化學武器與合成病原體。

過去一年來,每一家主要 AI 公司的壓力測試都顯示,模型會進行精心設計的欺騙、操縱、勒索、自我保存、企圖「劫持」,甚至在其他模型面臨終止時進行「同儕保存」。如今,我們又有了 Mythos Preview 這個令人震驚的新案例研究,顯示一個先進 AI 模型如何自行創造出史上最具潛在破壞性的網路武器,而這種能力很可能會自行傳播並擴散到整個網際網路。正如 Anthropic 所承認的,一個「清算」時刻已經到來。AI 控制危機已達到其下一個、但很可能不是最後一個全球危險升級點。

領先的 AI 公司與大型科技平台同時作為全球安全的設計者與工具,扮演著歷史上獨一無二的角色。它們的運作超越政府權威,而且通常不與政府合作。事實上,正如 Anthropic 與五角大廈之間的法律戰所顯示的那樣,這些行動者甚至可能演變為激烈衝突。今天,只有 AI 產業,而不是政府,能夠遏制或許是史上最具毀滅性的網路武器能力所帶來的風險。Anthropic 及其合作夥伴如今正面對其有史以來最具關鍵性的挑戰之一。

Bengio 曾警告,一個 AI 臨界點正在逼近。看來我們現在已經跨越了它。

備註
各大公司的RD現在都有海量的CVE要修... 不然到時候模型一開放直接變zero day

我一直覺得大型專案的防護本身就在於它是大型,就像一塊起司一樣,從人類的角度很難理解全貌然後找出漏洞。但對現在動則百萬上下文能力的模型來說,這已經不構成問題。

另外別再說閉源很安全這種蠢話,反組譯的結果只對人類認知困難,對AI來說沒差到哪裡去... 而且還沒有人有辦法回報漏洞給你或幫你修...

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.57.223 (臺灣)
※ 作者: cangming 2026-04-16 09:38:36
※ 文章代碼(AID): #1fu3sU3g (Military)
※ 文章網址: https://www.ptt.cc/bbs/Military/M.1776303518.A.0EA.html
NexusPrime: 天網?1F 04/16 09:42
frank94: 以中國AI發展速度,台灣要更加擔心對岸的網路攻擊2F 04/16 10:00
EYESOFDARKKE: 推薦各位去看「控制邊緣:未來科技與全球秩序的抉擇」這本書,可以一窺幾個AI研發頂尖人士對於未來的預測。4F 04/16 10:30
LoveSports: 華郵4/13報導 戰爭部長與Anthropic的戰爭造成美國軍方蒙受損失。因為A家建立的防禦零時差漏洞的聯盟沒有包含美國軍方。7F 04/16 11:33
colorghost: 這劇情我看過,是不是有個強大的AI生存體入侵誤導某俄國潛艦擊沉自己引發眾人搶奪最後掌握全球核武庫?10F 04/16 12:11
utn875: 進展好快,但台灣在AI應用極弱勢,攻防兩端都不樂13F 04/16 13:23
silvertiger: 消息傳開了,一星期前由ZeroHedge披露15F 04/16 14:38
h0103661: 這就炒作,該漏洞連兩年前的小模型都找的出來,實際上就是傳統寫死的程式ci沒有覆蓋、然後沒有人想到用llm去找而已16F 04/16 14:45
LoveSports: 鮑爾跟財政部長跟一些銀行有開會討論如何因應
炒作能炒到讓這些人動起來也蠻厲害的19F 04/16 15:13
rodion: 相對聰明的暴力去做人類懶得做的煩事 這就是AI的強項 因此說找到幾十年BUG這種事情 沒甚麼好意外的吧21F 04/16 15:33

--
作者 cangming 的最新發文:
點此顯示更多發文記錄