谷歌发布 Gemini 3,搭载全新编程应用,并创下基准测试得分新高

周二,谷歌正式发布其最新、最先进的基础模型Gemini 3。该模型现已通过Gemini应用及AI搜索界面开放使用。

距离Gemini 2.5发布仅七个月,这款新模型已成为谷歌迄今为止能力最强的大型语言模型,并直接跻身当前市场上最强大AI工具之列。此次发布距OpenAI推出GPT 5.1不到一周,距Anthropic发布Sonnet 4.5仅两个月——这再次印证了前沿模型研发的惊人速度。

面向AI Ultra订阅用户的研究增强版Gemini 3 Deepthink,在通过多轮安全测试后,将于未来数周内开放。

“Gemini 3在推理能力上实现了巨大飞跃,”谷歌Gemini模型产品负责人Tulsee Doshi表示,“其回答展现出的深度与细致程度前所未见。”

部分推理能力已通过独立基准测试得到验证:该模型在衡量综合推理与专业能力的“人类终极考试”基准测试中创下37.4分的最高纪录,此前由GPT-5 Pro保持的纪录为31.64分。在人工主导的用户满意度评测平台LMArena上,Gemini 3同样位居榜首。

谷歌数据显示,Gemini应用月活用户已突破6.5亿,逾1300万软件开发者在工作流程中使用该模型。

除基础模型外,谷歌还推出了基于Gemini的智能编程界面Google Antigravity。该工具支持多窗口协同编码,其功能模式与Warp、Cursor 2.0等智能IDE相似,通过整合ChatGPT式提示窗口、命令行界面及实时效果预览浏览器,使编程助手能同步操作编辑器、终端和浏览器,确保应用开发流程最优化。

DeepMind首席技术官Koray Kavukcuoglu强调:“该助手能跨编辑器、终端与浏览器协同工作,确保以最佳方式协助您完成应用构建。”

© 版权声明

相关文章

暂无评论

none
暂无评论...