谷歌发布 Gemini 3，搭载全新编程应用，并创下基准测试得分新高

周二，谷歌正式发布其最新、最先进的基础模型Gemini 3。该模型现已通过Gemini应用及AI搜索界面开放使用。

距离Gemini 2.5发布仅七个月，这款新模型已成为谷歌迄今为止能力最强的大型语言模型，并直接跻身当前市场上最强大AI工具之列。此次发布距OpenAI推出GPT 5.1不到一周，距Anthropic发布Sonnet 4.5仅两个月——这再次印证了前沿模型研发的惊人速度。

面向AI Ultra订阅用户的研究增强版Gemini 3 Deepthink，在通过多轮安全测试后，将于未来数周内开放。

“Gemini 3在推理能力上实现了巨大飞跃，”谷歌Gemini模型产品负责人Tulsee Doshi表示，“其回答展现出的深度与细致程度前所未见。”

部分推理能力已通过独立基准测试得到验证：该模型在衡量综合推理与专业能力的“人类终极考试”基准测试中创下37.4分的最高纪录，此前由GPT-5 Pro保持的纪录为31.64分。在人工主导的用户满意度评测平台LMArena上，Gemini 3同样位居榜首。

谷歌数据显示，Gemini应用月活用户已突破6.5亿，逾1300万软件开发者在工作流程中使用该模型。

除基础模型外，谷歌还推出了基于Gemini的智能编程界面Google Antigravity。该工具支持多窗口协同编码，其功能模式与Warp、Cursor 2.0等智能IDE相似，通过整合ChatGPT式提示窗口、命令行界面及实时效果预览浏览器，使编程助手能同步操作编辑器、终端和浏览器，确保应用开发流程最优化。

DeepMind首席技术官Koray Kavukcuoglu强调：“该助手能跨编辑器、终端与浏览器协同工作，确保以最佳方式协助您完成应用构建。”