
商傳媒|葉安庭/綜合外電報導
人工智慧公司Anthropic開發中的高風險AI模型「Mythos」近日傳出遭未經授權用戶入侵,此事件引發外界對高能力AI安全性的高度關注。與此同時,Anthropic已於今日發布了代號為「Opus 4.7」的「民用安全」版本,該版本經特別調校以降低網路攻擊能力。
根據多份外洩文件與媒體報導,Mythos模型是Anthropic迄今最先進的系統,具備遠超其他AI模型的網路攻防能力,尤其在程式編碼、學術推理和網路安全測試方面表現突出。Anthropic曾警告,Mythos系統「目前在網路能力方面遙遙領先其他任何AI模型」,若落入不法分子手中,恐將助長超越防禦者的網路攻擊,因此被視為「具有前所未有的網路安全風險」。
此次入侵事件是透過Anthropic的第三方供應商環境發生,而非該公司內部系統遭到破壞。據《Bloomberg》報導,一群未經授權的用戶利用多種策略,透過一個搜尋未發布AI模型的Discord頻道,成功進入並持續使用了Mythos。面對此資安事件,Anthropic已展開調查,並強調其自有系統並未受到影響。
為應對高風險AI技術的潛在威脅,Anthropic啟動了「Project Glasswing」安全倡議,旨在協助企業防範AI驅動的攻擊。根據《MSN》報導,在該專案下,Anthropic正與亞馬遜、蘋果、思科、摩根大通、高盛、花旗集團、美國銀行和摩根士丹利等大型科技及金融機構合作,測試Mythos,協助這些企業強化資安防禦。美國財政部長史考特·貝森特(Scott Bessent)更於今年四月在華盛頓特區召集會議,鼓勵銀行高層利用Mythos來偵測系統漏洞。
由於Mythos的強大能力與潛在風險,Anthropic採取了極為謹慎的部署策略,僅向網路防禦者和關鍵基礎設施合作夥伴提供該模型的完全版本。而今日發布的Claude Opus 4.7,則是經過「差異化削弱」其網路攻擊能力的版本,使其無法作為數位武器使用。Opus 4.7也是Project Glasswing中首個部署的模型,內建自動化安全防護措施,能即時阻擋高風險的網路安全請求。
Opus 4.7不僅在性能上相較前一版有顯著提升,具備自主工程能力、自我驗證機制(有效減少幻覺)和高解析度視覺辨識功能,且據稱能生成更具「創意品味」的文件,減少AI生成感。Anthropic表示,客戶在使用Opus 4.7後,生產任務完成效率提高了三倍,視覺辨識準確度也高達98.5%。網路安全AI公司Assail執行長艾莉莎·瓦倫蒂娜·奈特(Alissa Valentina Knight)指出,如果攻擊者利用AI,其攻擊速度和能力將遠超人類,凸顯了控制高風險AI技術的急迫性。
