最新最全多模态AI的新闻资讯与知识教程-AI工具导航

Cohere发布开源语音转录模型Transcribe：专为本地部署设计，挑战行业标杆

在AI语音转录领域，一个专为消费级硬件优化的开源模型正引发关注。最新行业动态指出，知名企业AI公司Cohere正式推出了其首个语音模型——Transcribe。这款开源的自动语音识别（Automati...

3个月前

01260

Meta新AI模型“芒果”与“牛油果”曝光，2026年发布能否扭转落后局面？

在生成式AI竞赛中暂时落后的Meta，正押注于一套全新的多模态模型组合，以期在2026年实现技术反超。最新行业动态指出，该公司内部代号为“芒果”（Mango）的图像视频模型和“牛油果”（Avocado...

Ai新闻 # 2026AI趋势 # AI竞赛 # Avocado模型

6个月前

01130

Luma发布“统一智能”AI创意代理，能自主完成图文音视频全流程创作，广告制作成本骤降99%？

当一家广告公司需要为一个全球品牌制作数十个不同国家的本地化广告时，传统流程可能需要耗时一年、耗资数百万美元。如今，市场消息显示，一种名为AI创意代理 (AI Creative Agent)的新范式，正...

Ai新闻 # AI创意代理 # AI视频生成 # Luma AI

4个月前

01060

谷歌Gemini重塑电视交互：CES 2026展示AI如何让电视听懂人话、看懂照片

电视正在从一个被动的娱乐终端，转变为一个能理解、能对话、能学习的智能家庭中心。在近期的一场重要行业展会上，谷歌展示了其人工智能模型 Gemini 为电视带来的革命性交互升级。通过自然语言对话，用户不仅...

Ai新闻 # AI电视 # CES 2026 # Google TV

5个月前

0970

AI视频静音难题迎来破局者：Mirelo获4100万美元融资，专注音效生成构建技术护城河

当AI视频生成工具正以前所未有的速度普及，一个被长期忽视的短板正变得愈发刺眼——无声的影像。市场消息显示，一家名为Mirelo的德国初创公司，正凭借其专注于为AI视频生成同步音效（Sound Effe...

Ai新闻 # a16z # AI视频生成 # AI音效

6个月前

0900

图灵奖得主Yann LeCun新公司获10.3亿美元融资，押注“世界模型”颠覆AI格局

在通用人工智能（AGI）的探索道路上，一条依赖海量文本训练的路径正面临根本性质疑。最新市场消息显示，由图灵奖得主、深度学习先驱Yann LeCun联合创立的AI研究实验室AMI Labs，已完成高达1...

Ai新闻 # AGI # AI创业公司 # AI未来趋势

3个月前

0650

谷歌地图AI新功能：Gemini自动生成照片描述，提升本地内容贡献效率

地图应用的用户内容生态正迎来新一轮智能化升级。最新行业动态指出，谷歌地图（Google Maps）已开始测试并部署一项由AI驱动的核心功能：利用其多模态大模型Gemini，为用户上传的照片和视频自动生...

Ai新闻 # AI生成描述 # Gemini # 地图应用

2个月前

0480

AI视频独角兽Runway获3.15亿美元融资，估值53亿美元剑指下一代世界模型

在AI视频生成领域掀起技术浪潮的Runway，刚刚完成了一轮足以重塑行业格局的巨额融资。市场消息显示，这家明星初创公司成功筹集了3.15亿美元资金，其估值在短时间内飙升至53亿美元，几乎翻倍。这笔资金...

Ai新闻 # AI独角兽 # AI视频生成 # Gen 4.5

4个月前

0470

苹果Siri将迎革命性升级：Gemini AI加持，二月发布，能看能懂更智能

苹果的语音助手Siri，即将迎来其诞生以来最重大的一次变革。最新行业动态指出，苹果计划在二月下旬正式发布由谷歌Gemini人工智能模型驱动的全新Siri版本。这次升级被内部视为Siri首次真正兑现苹果...

Ai新闻 # AI语音助手 # Gemini AI # WWDC 2026

5个月前

0470

谷歌Gemini应用上线AI音乐生成功能：用文字描述创作30秒歌曲，支持多国语言

只需一段文字描述，就能让AI为你创作一首包含歌词和封面的完整歌曲。最新行业动态指出，谷歌已为其人工智能助手应用Gemini上线了一项全新的音乐生成功能，该功能基于DeepMind研发的Lyria 3模...

Ai新闻 # AIGC # AI音乐生成 # DeepMind

4个月前

0400