AMD AI 總監 Stella Laurenzo 日前在 Claude Code 官方 GitHub 倉庫提交問題報告,附上 6,852 個真實工程會話日誌,指控 Anthropic 旗下 AI 編程工具 Claude Code 自今年 2 月更新後出現系統性效能退化,思考深度中位數暴跌 67%,月度 API 費用更從 345 美元(約港幣 HK$2,691)急升至 42,121 美元(約港幣 32.8 萬元),升幅約 122 倍。Anthropic 官方回應稱問題源於參數調整,惟開發者社群普遍不接受此說法。
AMD 總監直接在 GitHub 開炮,附 6,852 筆日誌為證
Stella Laurenzo 把詳盡實測報告直接提交至 Claude Code 官方 GitHub 倉庫,等同公開向 Anthropic 施壓。報告基於 6,852 個真實工程會話完整日誌,指 Claude Code 在今年 2 月完成大型更新後,模型效能出現顯著下滑:思考深度中位數下跌 67%,模型在修改程式碼前研究投入減少約 70%。更值得關注是,模型出現「推拖」及「提前終止」等偷懶行為,在短短 17 天內觸發多達 173 次。Laurenzo 直接下結論:「Claude 已無法被信任執行複雜工程任務。」其團隊已轉用其他 AI 服務供應商。
API 費用飆升逾百倍,空燒 Token 成主因
最令開發者嘩然是費用數字。在相同請求量下,月度 API 費用從 345 美元(約港幣 HK$2,691)急升至 42,121 美元(約港幣 32.8 萬元),升幅約 122 倍。這現象反映 Claude Code 並非單純變慢或變差,而是把大量 Token(API 計費單位,可理解為 AI 每次處理文字量)白白消耗在無效工作迴圈上,未能有效完成任務卻大幅推高使用成本。

Anthropic 解釋:調參所致,非核心退化
Anthropic 團隊成員 Boris 在 GitHub 上回應,指問題源於兩次參數調整:一是 2 月 9 日引入「自適應思考」機制,讓模型根據任務難度自動調整思考量;二是 3 月 3 日將預設思考等級由「高」調低至「中等」。Boris 強調這並非模型核心能力退化,並建議用戶手動將 effort 參數調回最高等級 Max 以恢復效能。
然而開發者社群對此解釋並不買帳。大量用戶反映,即使手動將參數調至最高,模型「急於交差、隨便給答案」行為模式仍然比更新前明顯,認為官方說法未有正面回應問題所在。
隱藏思考記錄功能,反成不信任導火線
報告亦點出另一敏感議題:Anthropic 早前推出「隱藏思考內容」功能,用戶無法查閱模型完整推理過程。在模型正常運作時,此設計或僅屬介面安排;但在效能退化期間,這功能客觀上遮蔽用戶發現問題線索,令用戶更難察覺模型已開始偷懶,進一步加深社群對 Anthropic 不信任感。
用戶大規模出走,轉投 OpenAI Codex
報告發布後短短數日,已有大量 Claude Code 用戶宣布取消訂閱,轉向 OpenAI Codex 等替代工具。部分開發者表示,早在數週前已察覺 Claude Code「變笨」,惟苦無量化數據佐證,是次報告正好為其直觀感受提供實證支持。
隨著 AI 編程工具競爭日趨激烈,Anthropic 能否就此事提出令社群信服解釋,並切實改善 Claude Code 效能與透明度,將直接影響其開發者市場地位。若事件持續發酵,不排除 Anthropic 會推出具體修復更新以挽回用戶信心。
來源: The Register
