
Anthropic的AI模型Claude Mythos在受控安全評估中,於數小時內突破美國國家安全局機密系統,導致美國政府首次對AI模型實施出口管制,凸顯先進AI在國安領域的潛在風險。
人工智慧公司Anthropic開發的AI模型Claude Mythos,據稱在一次受控的安全評估中,於數小時內成功突破美國國家安全局(NSA)幾乎所有機密系統。此事件促使美國政府史無前例地針對AI模型本身祭出出口禁令。
根據參議院情報委員會副主席馬克·沃納(Mark Warner)參議員的說法,這項資訊來自美國國家安全局局長暨美國網路司令部(U.S. Cyber Command)司令約書亞·路德(Joshua Rudd)將軍的簡報。路德將軍指出,這項AI工具「在數小時而非數週內」就攻破了機密系統。這次突破發生在一次預先授權的內部紅隊測試(red-team test)中,Claude Mythos在高度特定的模擬環境下,與其他防禦工具結合使用。
安全評估結束的隔天,即6月12日,美國政府便發布了一項指令,禁止所有外籍人士接觸Anthropic旗下的Fable 5與Mythos 5模型。Anthropic隨後在全球範圍內停用了這些模型,因為該公司表示無法在技術上僅對特定國籍執行存取限制。這也是美國首次將出口管制直接應用於AI模型,而非僅限於驅動模型的硬體。
Anthropic對此爭議提出異議,指出他們收到的禁令函並未具體說明底層擔憂,僅口頭告知可能存在「潛在的狹隘、非普適性越獄」(jailbreak),即模型能識別軟體漏洞。Anthropic強調,這種越獄行為也存在於其競爭對手OpenAI的GPT-5.5等模型中。該公司認為,所指出的行為僅限於要求模型分析程式碼並修復已知的少數小錯誤,並非真正意義上的自主惡意入侵。
Anthropic目前正與白宮合作,共同制定一套風險管理框架,以期能恢復模型存取。此外,《金融時報》先前報導指出,約有六名Anthropic工程師已常駐美國國家安全局內部,負責為其特定作戰應用,如滲透中國與伊朗等國家的網路,客製化Claude Mythos。
