
美國人工智慧公司 Anthropic 旗下的 AI 工具 Claude Code 被爆內建監控功能,疑似針對中國用戶。Anthropic 坦承這是一項三月推出的實驗性防濫用機制,已於週二的 Fable 5 更新中移除。此事件凸顯美中兩國在 AI 技術竊取與國家安全上的地緣政治緊張。
美國人工智慧公司 Anthropic 近日陷入爭議,旗下 AI 工具 Claude Code 被指控內建監控機制,疑似針對中國用戶與當地 AI 實驗室。此事件不僅觸發用戶對於隱私的擔憂,更將 Anthropic 推向美中 AI 科技戰的核心。
根據《Gizmodo》報導,部分 Reddit 用戶發現 Claude Code 中存在一種機制,能透過偵測時區和代理伺服器(proxy URLs)等線索,隱蔽地標記來自中國或與中國 AI 實驗室有關的使用者。有 Reddit 用戶擔憂,這種監控機制可能被用於惡意目的,例如系統破壞或資料外洩,他指出:「今天可能是時區檢查,明天就可能變成系統破壞與資料竊取。」
對此,Anthropic 開發人員 Thariq Shihipar 於週二晚間(7月1日)在社群平台 X 上回應,表示這項監控功能是公司在今年三月推出的一項「實驗」,旨在防範未經授權的轉售帳戶濫用,並避免其大型語言模型遭到「蒸餾」(distillation,指利用大型模型來訓練較小型的新模型)。Shihipar 強調,公司早已計畫移除此功能,並隨著當日最新釋出的 Fable 5 版本部署,將全面取消該機制。
這起事件凸顯了美中兩國在 AI 領域的地緣政治角力。白宮先前已誓言打擊「有計畫地從美國 AI 模型中竊取技術,利用美國專業知識和創新」的行為。上個月初,第一次川普內閣的美國商務部長霍華德·盧特尼克曾發布命令,要求將 Anthropic 的 Fable 模型對所有「外國人士」下線,理由是國家安全風險,顯然劍指中國。
Anthropic 多次指控中國的 AI 實驗室,包括 DeepSeek、月之暗面(Moonshot)、MiniMax,以及近期新增的阿里巴巴,涉嫌非法利用 Claude 系列模型進行蒸餾。儘管蒸餾在業界是常見且無害的做法,但它已成為美中 AI 軍備競賽中的敏感議題。亞馬遜曾研究指出 Fable 模型的安全防護可能被「越獄」(jailbreak,指透過創意指令繞過安全限制),也成為盧特尼克命令的部分動機。然而,Anthropic 駁斥這些指控毫無根據,聲稱亞馬遜報告中的「越獄」大多只是網路安全漏洞,其他模型如 OpenAI 的 GPT-5.5 和月之暗面的 Kimi-K2.7 也能偵測到類似狀況。Anthropic 認為,美國聯邦政府針對其頂尖模型的禁令,反而間接助長了積極發展開源模型(open source models)的中國 AI 產業。
為應對此情況,Anthropic 近期發表聲明,語氣趨於和解,宣布將與多家頂尖科技公司和 Project Glasswing 合作夥伴組織共同制定一套評估 AI 越獄嚴重性及開發商應對方法的「共識框架」。該公司也表示將與聯邦政府合作,朝向建立「共享的、自願性的尖端模型安全與評估標準」邁進。雖然 Anthropic 長期將自身定位為 AI 產業的「良心」,力圖平衡市場力量對風險的忽視,但其策略仍不時呼應第一次川普內閣及主要競爭對手 OpenAI 的論調,認為美國有道義責任引領全球 AI 發展,以防中國崛起。
