谷歌Gemini Pro 3.1再破基准测试纪录,AI智能体能力迎来关键跃升 在大型语言模型(LLM)的军备竞赛白热化之际,一项新的性能标杆已然树立。最新行业动态指出,谷歌最新发布的Gemini Pro 3.1模型在多项权威基准测试中刷新了纪录,尤其在衡量AI执行真实专业任务能... Ai新闻# AI基准测试# AI智能体# APEX基准 4周前0140
谷歌发布最强AI研究代理Gemini Deep Research,同日OpenAI祭出GPT-5.2,AI巨头对决白热化 据TechCrunch等多家科技媒体报道,人工智能领域的巨头竞赛在近日达到新的高潮。谷歌于周四正式发布了其研究代理工具Gemini Deep Research的“重新构想”版本,该工具基于其备受瞩目的... Ai新闻# Agentic AI# AI基准测试# AI幻觉 3个月前0480