Anthropic发布其最佳编程AI模型Claude Sonnet 4.5
周一,人工智能公司Anthropic发布了新一代前沿模型Claude Sonnet 4.5。该公司宣称,该模型在代码基准测试中展现出顶尖性能,能够构建”可直接投入生产”的应用程序,而不仅仅是原型——这标志着AI模型在可靠性方面实现了重大飞跃。
Claude Sonnet 4.5将通过Claude API和Claude聊天机器人向用户开放。面向开发者的定价与Claude Sonnet 4保持一致:每百万输入token收费3美元(约合75万单词,相当于《指环王》全系列的字数),每百万输出token收费15美元。
过去一年间,Anthropic的AI模型因其在软件工程任务中的卓越表现,已成为开发者和企业用户的首选。据报道,苹果和Meta均在内部使用Claude AI模型,而Anthropic还通过向Cursor、Windsurf和Replit等AI编程应用提供API接入,创造了可观营收。不过,OpenAI最新发布的GPT-5已在多项编码基准测试中超越Claude模型,对其市场主导地位构成了挑战。
Anthropic表示,Claude Sonnet 4.5在SWE-Bench Verified等多项编码基准测试中表现出行业领先水平。但该公司AI研究员David Hershey向TechCrunch透露,仅凭基准测试难以全面展现该模型的真实能力。
Hershey透露,在早期企业客户试用中,他目睹Claude Sonnet 4.5持续自主编程长达30小时。在此期间,该AI模型不仅构建了应用程序,还完成了数据库服务部署、域名购买等操作,甚至进行了SOC 2安全审计以确保产品合规性。
Cursor首席执行官Micheal Truell在声明中指出,Claude Sonnet 4.5展现了当前最先进的编码性能,尤其在长周期任务中表现突出。Windsurf首席执行官Jeff Wang则评价该模型代表了”新一代编程模型的诞生”。
Anthropic同时宣称,Claude Sonnet 4.5是其迄今与人类价值观最契合的前沿AI模型,相较于前代产品,其谄媚性和欺骗行为发生率显著降低。公司还改进了模型对提示注入攻击的防御能力。
伴随新模型发布,Anthropic同步推出了Claude Agent SDK开发工具包。该公司表示,这套基础设施与Claude Code同源,可帮助开发者构建专属智能体。
面向Max订阅用户,Anthropic还开放了名为”Imagine with Claude”的临时研究预览功能,实时展示AI模型生成软件的过程。据称,该模型能实时响应用户需求,无需预设功能或预写代码。
AI领域的激烈竞争使得各大公司每隔数月就会推出旗舰模型。距离Anthropic上一款模型Claude Opus 4.1发布尚不足两月,Claude Sonnet 4.5便火速面世。这种快速迭代的节奏,使得任何企业都难以长期保持显著领先优势。