AI基准测试

共 2 篇文章

排序

发布更新浏览点赞评论

谷歌Gemini Pro 3.1再破基准测试纪录，AI智能体能力迎来关键跃升

谷歌Gemini Pro 3.1再破基准测试纪录，AI智能体能力迎来关键跃升

在大型语言模型（LLM）的军备竞赛白热化之际，一项新的性能标杆已然树立。最新行业动态指出，谷歌最新发布的Gemini Pro 3.1模型在多项权威基准测试中刷新了纪录，尤其在衡量AI执行真实专业任务能...

Ai新闻 # AI基准测试 # AI智能体 # APEX基准

4周前

0140

谷歌发布最强AI研究代理Gemini Deep Research，同日OpenAI祭出GPT-5.2，AI巨头对决白热化

谷歌发布最强AI研究代理Gemini Deep Research，同日OpenAI祭出GPT-5.2，AI巨头对决白热化

据TechCrunch等多家科技媒体报道，人工智能领域的巨头竞赛在近日达到新的高潮。谷歌于周四正式发布了其研究代理工具Gemini Deep Research的“重新构想”版本，该工具基于其备受瞩目的...

Ai新闻 # Agentic AI # AI基准测试 # AI幻觉

3个月前

0480