綜合外電報導,AI 新創 Anthropic 周一 (24 日) 推出最新模型 Claude Opus 4.5,主打寫程式和自動化辦公室任務。該公司表示,新模型在寫程式能力測試中超越 Google 剛發布的 Gemini 3 Pro 和 OpenAI 的 GPT-5.1,並在內部測試中首次擊敗所有人類工程師。
Anthropic 表示,新模型在軟體工程工作上更勝以往,例如在不需要用戶協助的情況下修復錯誤,也能更好地在用戶電腦和網路上執行複雜的多步驟任務。
Anthropic 由 OpenAI 前員工於 2021 年創立,目前擁有超過 30 萬企業客戶,在電腦程式設計領域已成為市場領導者。但該公司正面臨來自 OpenAI 和 Google 的激烈競爭,後者上周發布 Gemini 3,在 AI 社群和投資人間引發熱烈迴響。
Claude Opus 4.5 是 Anthropic 兩個月內第三次重大模型發布,凸顯 AI 產業不停歇的開發步調。該公司 9 月底推出 Claude Sonnet 4.5 模型,隨後在 10 月發布 Claude Haiku 4.5 模型。
根據衡量 AI 系統軟體寫程式能力的測試基準 SWE-bench Verified,Claude Opus 4.5 在代理寫程式 (agentic coding) 方面達到最先進水準,優於 Google 上周發布的 Gemini 3 Pro 和 OpenAI 的 GPT-5.1。
官方在部落格中表示,新模型在處理試算表、簡報和進行深入研究等日常任務上「明顯更好」,也適合專業軟體開發人員和金融分析師、顧問、會計師等知識工作者使用。
除了模型發布,該公司周一還宣布多項產品和功能更新。Anthropic 也將 Opus 4.5 整合到微軟 (MSFT.US) Excel 軟體中,供企業客戶和訂閱高階 Max 方案的個人使用,用戶可透過聊天,指示 Claude 執行編輯試算表等任務。此外,允許 Claude 在瀏覽器分頁中採取行動的擴充功能 Claude for Chrome,正擴展到所有 Max 用戶。
Anthropic 上周獲得微軟和輝達 (NVDA.US) 數十億美元投資,使這家 AI 實驗室的估值提升至約 3,500 億美元。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網