AI工具导航
  • 首页
  • 排行榜
  • Ai新闻
  • 投稿
      • 未登录
        登录后即可体验更多功能
    • 首页
    • 排行榜
    • Ai新闻
    • 投稿
    未登录
    登录后即可体验更多功能

    多模态AI

    共 21 篇文章
    排序
    发布更新浏览点赞评论
    Cohere发布开源语音转录模型Transcribe:专为本地部署设计,挑战行业标杆

    Cohere发布开源语音转录模型Transcribe:专为本地部署设计,挑战行业标杆

    在AI语音转录领域,一个专为消费级硬件优化的开源模型正引发关注。最新行业动态指出,知名企业AI公司Cohere正式推出了其首个语音模型——Transcribe。这款开源的自动语音识别(Automati...
    Ai新闻# Cohere# North平台# Transcribe
    3个月前
    01260
    Meta新AI模型“芒果”与“牛油果”曝光,2026年发布能否扭转落后局面?

    Meta新AI模型“芒果”与“牛油果”曝光,2026年发布能否扭转落后局面?

    在生成式AI竞赛中暂时落后的Meta,正押注于一套全新的多模态模型组合,以期在2026年实现技术反超。最新行业动态指出,该公司内部代号为“芒果”(Mango)的图像视频模型和“牛油果”(Avocado...
    Ai新闻# 2026AI趋势# AI竞赛# Avocado模型
    6个月前
    01130
    Luma发布“统一智能”AI创意代理,能自主完成图文音视频全流程创作,广告制作成本骤降99%?

    Luma发布“统一智能”AI创意代理,能自主完成图文音视频全流程创作,广告制作成本骤降99%?

    当一家广告公司需要为一个全球品牌制作数十个不同国家的本地化广告时,传统流程可能需要耗时一年、耗资数百万美元。如今,市场消息显示,一种名为AI创意代理 (AI Creative Agent)的新范式,正...
    Ai新闻# AI创意代理# AI视频生成# Luma AI
    4个月前
    01060
    谷歌Gemini重塑电视交互:CES 2026展示AI如何让电视听懂人话、看懂照片

    谷歌Gemini重塑电视交互:CES 2026展示AI如何让电视听懂人话、看懂照片

    电视正在从一个被动的娱乐终端,转变为一个能理解、能对话、能学习的智能家庭中心。在近期的一场重要行业展会上,谷歌展示了其人工智能模型 Gemini 为电视带来的革命性交互升级。通过自然语言对话,用户不仅...
    Ai新闻# AI电视# CES 2026# Google TV
    5个月前
    0970
    AI视频静音难题迎来破局者:Mirelo获4100万美元融资,专注音效生成构建技术护城河

    AI视频静音难题迎来破局者:Mirelo获4100万美元融资,专注音效生成构建技术护城河

    当AI视频生成工具正以前所未有的速度普及,一个被长期忽视的短板正变得愈发刺眼——无声的影像。市场消息显示,一家名为Mirelo的德国初创公司,正凭借其专注于为AI视频生成同步音效(Sound Effe...
    Ai新闻# a16z# AI视频生成# AI音效
    6个月前
    0900
    图灵奖得主Yann LeCun新公司获10.3亿美元融资,押注“世界模型”颠覆AI格局

    图灵奖得主Yann LeCun新公司获10.3亿美元融资,押注“世界模型”颠覆AI格局

    在通用人工智能(AGI)的探索道路上,一条依赖海量文本训练的路径正面临根本性质疑。最新市场消息显示,由图灵奖得主、深度学习先驱Yann LeCun联合创立的AI研究实验室AMI Labs,已完成高达1...
    Ai新闻# AGI# AI创业公司# AI未来趋势
    3个月前
    0650
    谷歌地图AI新功能:Gemini自动生成照片描述,提升本地内容贡献效率

    谷歌地图AI新功能:Gemini自动生成照片描述,提升本地内容贡献效率

    地图应用的用户内容生态正迎来新一轮智能化升级。最新行业动态指出,谷歌地图(Google Maps)已开始测试并部署一项由AI驱动的核心功能:利用其多模态大模型Gemini,为用户上传的照片和视频自动生...
    Ai新闻# AI生成描述# Gemini# 地图应用
    2个月前
    0480
    AI视频独角兽Runway获3.15亿美元融资,估值53亿美元剑指下一代世界模型

    AI视频独角兽Runway获3.15亿美元融资,估值53亿美元剑指下一代世界模型

    在AI视频生成领域掀起技术浪潮的Runway,刚刚完成了一轮足以重塑行业格局的巨额融资。市场消息显示,这家明星初创公司成功筹集了3.15亿美元资金,其估值在短时间内飙升至53亿美元,几乎翻倍。这笔资金...
    Ai新闻# AI独角兽# AI视频生成# Gen 4.5
    4个月前
    0470
    苹果Siri将迎革命性升级:Gemini AI加持,二月发布,能看能懂更智能

    苹果Siri将迎革命性升级:Gemini AI加持,二月发布,能看能懂更智能

    苹果的语音助手Siri,即将迎来其诞生以来最重大的一次变革。最新行业动态指出,苹果计划在二月下旬正式发布由谷歌Gemini人工智能模型驱动的全新Siri版本。这次升级被内部视为Siri首次真正兑现苹果...
    Ai新闻# AI语音助手# Gemini AI# WWDC 2026
    5个月前
    0470
    谷歌Gemini应用上线AI音乐生成功能:用文字描述创作30秒歌曲,支持多国语言

    谷歌Gemini应用上线AI音乐生成功能:用文字描述创作30秒歌曲,支持多国语言

    只需一段文字描述,就能让AI为你创作一首包含歌词和封面的完整歌曲。最新行业动态指出,谷歌已为其人工智能助手应用Gemini上线了一项全新的音乐生成功能,该功能基于DeepMind研发的Lyria 3模...
    Ai新闻# AIGC# AI音乐生成# DeepMind
    4个月前
    0400
    加载更多
    AI工具导航
    我们将更多的 AI 工具带到你面前。致力于让更多人先看到未来的创作与工作方式。
    Copyright © 2026 AI工具导航 沪ICP备2020026270号-2 
    网址
    网址文章