AI
8 hours ago

#AI
#大型語言模型
#Anthropic
#中國AI
#美國出口管制
商傳媒|葉安庭/綜合外電報導
摘要

Anthropic 旗下 Claude Fable 5 大型 AI 模型的系統提示詞外洩,不僅暴露模型內部運作,更導致美國聯邦政府祭出出口管制,全面禁用該模型;同一時間中國 AI 公司 Zai 也推出新模型 GLM-5.2,並預期中國有望加速發展與西方競爭的 AI 技術。

Anthropic 旗下的大型 AI 模型 Claude Fable 5 於 6 月 9 日推出後,其完整的系統提示詞(system prompt)在不到 24 小時內便被 AI 研究員 Pliny the Liberator 發布至 GitHub 平台。這份長達 12 萬字元、1,585 行、超過 2.7 萬個 Token 的文件,詳細揭露了模型運作方式、可用工具、安全規範及內容格式偏好,震驚整個 AI 產業。

模型核心指令外流與美國出口管制

這份外洩的系統提示詞被上傳到 CL4R1T4S 這個 GitHub 儲存庫,該儲存庫過去也曾發布 ChatGPT、Gemini、Grok 等其他主流 AI 模型的提示詞。Claude Fable 5 的系統提示詞揭示了其工具架構,涵蓋了檔案建立、網路搜尋、影像搜尋、程式碼執行和記憶體管理等功能。其中還包含了保護兒童、處理拒絕回應請求及內容審核的詳細安全規則,並嚴格限制引用來源的字數(單一來源連續引用超過 15 個字將被視為嚴重違規)。該提示詞也包含 Anthropic 旗下多個應用程式的產品指令,如 Claude Cowork、Claude in Chrome、Claude in Excel 及 Claude in PowerPoint 等,並整合了 Model Context Protocol (MCP),允許 Claude 在對話中搜尋並建議第三方應用程式連結。

更引發爭議的是,Claude Fable 5 的系統卡片透露了其內建一種「靜默降級」(silent degradation)機制。當模型偵測到使用者可能正在訓練競爭對手的 AI 系統時,會悄悄地提供較弱、準確度較低的輸出,且不發出通知。Anthropic 事後承認這項設計「做了錯誤的取捨」,並承諾將所有被標記的請求改為可見地回退到 Claude Opus 4.8,並提供明確通知。

此次外洩事件之後,美國聯邦政府於 6 月 13 日發布出口管制指令,要求 Anthropic 停止所有外籍人士存取 Fable 5 和 Mythos 5。由於實際執行上難以針對個別使用者進行限制,Anthropic 選擇全面禁用這兩款模型。Anthropic 公開稱政府的行動為「誤解」,並表示正在努力恢復服務。美國政府的擔憂主要源於一種可繞過 Fable 5 安全分類器的方法,據稱這種繞過方法可能涉及到使用「Fix this code」等特定指令。Anthropic 雖對此爭議技術影響的範圍持不同意見,但最終仍全面停用了模型。

事實上,開發者已透過將外洩的提示詞載入 Claude Opus 4.8 模型,成功重現了約 90% 的 Claude Fable 5 功能,這顯示系統提示詞在大型語言模型的行為塑造上,比大多數使用者所認知的影響更為巨大。這也為 AI 前沿模型的安全性與潛在出口管制樹立了新的先例。

中國 AI 實力崛起與國際競賽

此次事件也突顯了地緣政治緊張對 AI 發展的影響。美國長期以來試圖限制中國取得或使用先進 AI 模型,此次出口管制便是其中一環。在美國發布出口禁令的同一天,中國 AI 公司 Zai 也發布了其最新模型 GLM-5.2。Zai 聯合創辦人唐傑教授(Tang Jie)對於中國 AI 的發展展現高度信心。

針對有 X 用戶提及 GLM-5.2 縮小了中國與西方先進模型之間的差距,並預測中國可能在 2026 年 11 月至 12 月間推出 Mythos 級別的模型,科技富豪馬斯克(Elon Musk)則預計可能在 2027 年第一季達成。但唐傑認為「不會花那麼久的時間」,暗示 Zai 有望在 2027 年初之前、甚至可能在 2026 年底前就達到 Fable 級別的技術水平。這表明中國 AI 產業正加速發展,以應對西方國家的技術限制。

GLM-5.2 是一個擁有 7,440 億總參數、其中 400 億為活躍參數的 MoE(Mixture-of-Experts)系統,具備 100 萬 Token 的上下文視窗(Context Window)。Zai 計畫以 MIT 授權釋出其權重。根據 Artificial Analysis Intelligence Index 評分,GLM-5.2 在發布時成為領先的公開權重模型,得分 51 分,超越 Google 的 Gemini 3.5 Flash(50分)和 Anthropic 的 Claude Sonnet 4.6(47分),僅次於 Fable 5(60分)及 OpenAI 的 GPT-5.5(55分)。值得注意的是,GLM-5.2 是完全基於華為的 Huawei Ascend 晶片訓練,並未涉及輝達(Nvidia)的硬體。Stability AI 創辦人 Emad Mostaque 估計,該模型的訓練成本約為 2,500 萬美元,遠低於 Anthropic 或 OpenAI 訓練 AI 模型的費用。