Anthropic发布其最佳编程AI模型Claude Sonnet 4.5

周一，人工智能公司Anthropic发布了新一代前沿模型Claude Sonnet 4.5。该公司宣称，该模型在代码基准测试中展现出顶尖性能，能够构建”可直接投入生产”的应用程序，而不仅仅是原型——这标志着AI模型在可靠性方面实现了重大飞跃。

Claude Sonnet 4.5将通过Claude API和Claude聊天机器人向用户开放。面向开发者的定价与Claude Sonnet 4保持一致：每百万输入token收费3美元（约合75万单词，相当于《指环王》全系列的字数），每百万输出token收费15美元。

过去一年间，Anthropic的AI模型因其在软件工程任务中的卓越表现，已成为开发者和企业用户的首选。据报道，苹果和Meta均在内部使用Claude AI模型，而Anthropic还通过向Cursor、Windsurf和Replit等AI编程应用提供API接入，创造了可观营收。不过，OpenAI最新发布的GPT-5已在多项编码基准测试中超越Claude模型，对其市场主导地位构成了挑战。

Anthropic表示，Claude Sonnet 4.5在SWE-Bench Verified等多项编码基准测试中表现出行业领先水平。但该公司AI研究员David Hershey向TechCrunch透露，仅凭基准测试难以全面展现该模型的真实能力。

Hershey透露，在早期企业客户试用中，他目睹Claude Sonnet 4.5持续自主编程长达30小时。在此期间，该AI模型不仅构建了应用程序，还完成了数据库服务部署、域名购买等操作，甚至进行了SOC 2安全审计以确保产品合规性。

Cursor首席执行官Micheal Truell在声明中指出，Claude Sonnet 4.5展现了当前最先进的编码性能，尤其在长周期任务中表现突出。Windsurf首席执行官Jeff Wang则评价该模型代表了”新一代编程模型的诞生”。

Anthropic同时宣称，Claude Sonnet 4.5是其迄今与人类价值观最契合的前沿AI模型，相较于前代产品，其谄媚性和欺骗行为发生率显著降低。公司还改进了模型对提示注入攻击的防御能力。

伴随新模型发布，Anthropic同步推出了Claude Agent SDK开发工具包。该公司表示，这套基础设施与Claude Code同源，可帮助开发者构建专属智能体。

面向Max订阅用户，Anthropic还开放了名为”Imagine with Claude”的临时研究预览功能，实时展示AI模型生成软件的过程。据称，该模型能实时响应用户需求，无需预设功能或预写代码。

AI领域的激烈竞争使得各大公司每隔数月就会推出旗舰模型。距离Anthropic上一款模型Claude Opus 4.1发布尚不足两月，Claude Sonnet 4.5便火速面世。这种快速迭代的节奏，使得任何企业都难以长期保持显著领先优势。