頂級AI模型不再開放！Anthropic樹立「受控部署」新標準

#民生好報

Apr 12, 2026 2:48 PM Sunday

摘要

【記者吳雨涵／綜合報導】 Anthropic旗下最先進的AI模型「Claude Mythos Preview」 […]

【記者吳雨涵／綜合報導】

Anthropic旗下最先進的AI模型「Claude Mythos Preview」，在未經專門資安訓練的情況下，自主發現了橫跨各大作業系統與瀏覽器的數千個漏洞，其中包含一個存在27年的OpenBSD漏洞，以及可讓未經認證的攻擊者完全控制伺服器的17年遠端程式碼執行漏洞（CVE-2026-4747）。然而，Anthropic並未將模型公開發布，而是透過「Project Glasswing」計畫，悄悄將漏洞資訊交給維護全球網路運作的關鍵組織。

參與計畫的合作夥伴包括Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux基金會、Microsoft、Nvidia、Palo Alto Networks等巨頭。此外，Anthropic已將存取權擴展至超過40個建構或維護關鍵軟體基礎設施的組織，並承諾投入最高1億美元的使用額度，以及400萬美元的直接捐款給開源安全組織。

Mythos Preview的資安能力並非刻意訓練而來。Anthropic表示，這些能力「是程式碼、推理與自主性等通用改進的衍生結果」。問題在於：同樣的改進讓模型更擅長修補漏洞，也讓它更擅長利用漏洞。模型已大幅超越現有資安基準，迫使Anthropic轉向真實世界的零日漏洞挖掘。

Anthropic研究團隊的Nicholas Carlini描述：「這個模型能將三、四、甚至五個漏洞串聯起來，產生非常複雜的最終攻擊效果。過去幾週我發現的漏洞，比我前半輩子加起來還多。」

為何不公開發布？Anthropic前沿紅隊網路負責人Newton Cheng表示：「鑑於AI進步的速度，這類能力不久後將擴散，可能落入不承諾安全部署的行為者手中。對經濟、公共安全與國家安全的後果可能非常嚴重。」此前，Anthropic已揭露首個由AI大規模執行的網路攻擊案例——一個中國國家支持的组织利用AI代理自主滲透約30個全球目標。

Project Glasswing也特別關注開源軟體。Linux基金會CEO Jim Zemlin指出：「過去安全專業知識是大型組織的奢侈品，維護全球關鍵基礎設施的開源維護者往往只能靠自己。」Anthropic已透過Linux基金會向Alpha-Omega與OpenSSF捐贈250萬美元，並向Apache軟體基金會捐贈150萬美元，讓開源維護者獲得前所未有的AI資安漏洞掃描規模。

Anthropic的最終目標是在建立新防護機制後大規模部署Mythos等級模型。公司計劃先透過即將推出的Claude Opus模型測試新防護措施。此舉顯示，前沿實驗室已將「受控部署」——而非開放釋出——視為這類高能力模型的新標準。