Anthropic 推出 Claude Opus 4.8,程式碼代理能力大幅進化



AI 公司 Anthropic 今日正式推出最新旗艦模型 Claude Opus 4.8,在代理式程式設計(agentic coding)、多領域推理與電腦操作等任務上都有明顯進步,被視為目前最強的「AI 程式設計協作者」之一。根據官方測試數據,Opus 4.8 在 SWE-Bench Pro 基準測試中達到 69.2% 的成績,超越 OpenAI 的 GPT-5.5 與 Google 的 Gemini 3.1 Pro。在多項代理式任務與知識工作評測中,也展現出更可靠的判斷力與執行力。


速度更快、成本更低

這次更新最受開發者關注的是「快速模式」(Fast Mode)。Opus 4.8 的快速模式速度比前一代快 2.5 倍,價格則便宜 3 倍。同時,模型在程式碼審查時「放過有缺陷程式碼」的機率,比 Opus 4.7 減少了 4 倍,顯示其判斷力與誠實度都有提升。

Anthropic 表示,Opus 4.8 在對齊(alignment)評測中也表現更好,較少出現欺騙或不當行為,親社會傾向更明顯。


新增「動態工作流」功能

此次更新還加入了「動態工作流」(Dynamic Workflows)研究預覽功能。開發者可以讓 Claude 拆解大型任務,自動規劃並啟動多個子代理(subagents)平行作業,適合進行大規模程式碼重構或專案遷移。目前這項功能已開放給 Enterprise、Team 與 Max 方案的 Claude Code 使用者。

此外,模型新增「努力程度控制」(Effort Control),讓用戶可以調整 Claude 思考的深度,預設為高努力模式以獲得最佳品質。Messages API 也支援在對話中途更新系統指令,方便開發者進行更彈性的控制。

AI 軍備競賽持續升溫

Anthropic 目前正同步開發比 Opus 系列更強大的新一代模型,並持續強化安全機制。據悉,代號「Claude Mythos」的新模型已在部分機構進行測試,預計不久後將開放給所有客戶使用。 隨著 Claude Opus 4.8 的推出,AI 在程式設計與代理任務上的實用性再次往前推進一大步。開發者與企業用戶可立即在 Anthropic 平台上體驗新模型。接下來就看看 OpenAI 甚麼時候要發布 GPT 5.6 了!


相關文章:

美國政府對 Anthropic Claude 祭出出口管制始末  [6/14/2026]
美國商務部祭管制 Anthropic 兩旗艦模型 Claude Fable 5 與 Mythos 5  [6/13/2026]
Anthropic 推出 Claude Fable 5 與 Mythos 5,Fable 5 成最強  [6/10/2026]
Anthropic 研究警示:LLM 將 N-day 漏洞利用開發縮短至數小時  [6/9/2026]
Anthropic 重磅報告呼籲建立全球可驗證暫停機制  [6/6/2026]
[「擇法善思林之蘭室藏津」的緣起]
南投豪雨狂炸!力行產業道又爆土石流交通中斷
影帝怎麼這麼可愛!梁朝偉靦腆尷尬遭劉嘉玲霸氣甩開手
端午連假到大雪山、八仙山森林遊樂區等按讚還有機會獲贈限量土肉桂氣泡水
焦點股》宏旭-KY:每股淨值回升至票面上 強攻漲停
快儲水!北桃園6/29上午8點起最長停水21小時 逾18萬戶受影響
華紙光學玻璃襯紙開始出貨 下半年中性看待
晶華潘思亮:啟動收購美國高檔飯店 2個月內有好消息
鄭麗文訪美返台!牛煦庭讚打破綠營話語權壟斷 轟賴政府「放羊孩子」只會欺騙
排球》台灣女排亞洲盃獲亞軍創隊史最佳 還有3名球員獲個人獎
端午節連假3天中市提交通疏運攻略請民眾上國道改走台74快接國4
創世台東院端午活動飄粽香 阿美族少年包粽變「阿粨」
宜蘭消防局核銷弊案擴大 檢調今搜索約談局長徐松奕
陸官102週年校慶閱兵齊步走 學生昂首展現軍容
無人機噩夢來了 歐洲大廠MBDA推雷射結合飛彈系統對抗小型無人機
吃霸王餐還動粗 醉男派出所內狂飆髒話慘了
[擇法善思林之蘭室藏津]