AI工具导航
  • 首页
  • 排行榜
  • Ai新闻
  • 投稿
      • 未登录
        登录后即可体验更多功能
    • 首页
    • 排行榜
    • Ai新闻
    • 投稿
    未登录
    登录后即可体验更多功能

    多模态AI

    共 13 篇文章
    排序
    发布更新浏览点赞评论
    AI视频静音难题迎来破局者:Mirelo获4100万美元融资,专注音效生成构建技术护城河

    AI视频静音难题迎来破局者:Mirelo获4100万美元融资,专注音效生成构建技术护城河

    当AI视频生成工具正以前所未有的速度普及,一个被长期忽视的短板正变得愈发刺眼——无声的影像。市场消息显示,一家名为Mirelo的德国初创公司,正凭借其专注于为AI视频生成同步音效(Sound Effe...
    Ai新闻# a16z# AI视频生成# AI音效
    3个月前
    0530
    OpenAI图像生成模型GPT Image 1.5发布:指令跟随能力升级,生成速度提升4倍

    OpenAI图像生成模型GPT Image 1.5发布:指令跟随能力升级,生成速度提升4倍

    生成式人工智能领域的竞争正进入白热化阶段。最新行业动态指出,OpenAI已正式向所有用户推出其新一代图像生成模型GPT Image 1.5。该模型不仅承诺在指令遵循和编辑精度上实现显著提升,更将图像生...
    Ai新闻# AIGC# AI图像模型速度# AI指令跟随
    3个月前
    0230
    谷歌Gemini 3 Flash发布:速度与性能的平衡艺术,成AI应用新标配

    谷歌Gemini 3 Flash发布:速度与性能的平衡艺术,成AI应用新标配

    在追求极致速度与成本效益的AI竞赛中,一项新的行业标准正在被悄然改写。最新行业动态指出,谷歌已正式推出其新一代轻量级大模型Gemini 3 Flash,并已将其设置为旗下核心AI应用及搜索AI模式的默...
    Ai新闻# AI大模型# AI应用开发# AI模型定价
    3个月前
    0200
    Meta新AI模型“芒果”与“牛油果”曝光,2026年发布能否扭转落后局面?

    Meta新AI模型“芒果”与“牛油果”曝光,2026年发布能否扭转落后局面?

    在生成式AI竞赛中暂时落后的Meta,正押注于一套全新的多模态模型组合,以期在2026年实现技术反超。最新行业动态指出,该公司内部代号为“芒果”(Mango)的图像视频模型和“牛油果”(Avocado...
    Ai新闻# 2026AI趋势# AI竞赛# Avocado模型
    3个月前
    0590
    谷歌Gemini重塑电视交互:CES 2026展示AI如何让电视听懂人话、看懂照片

    谷歌Gemini重塑电视交互:CES 2026展示AI如何让电视听懂人话、看懂照片

    电视正在从一个被动的娱乐终端,转变为一个能理解、能对话、能学习的智能家庭中心。在近期的一场重要行业展会上,谷歌展示了其人工智能模型 Gemini 为电视带来的革命性交互升级。通过自然语言对话,用户不仅...
    Ai新闻# AI电视# CES 2026# Google TV
    2个月前
    0430
    苹果Siri将迎革命性升级:Gemini AI加持,二月发布,能看能懂更智能

    苹果Siri将迎革命性升级:Gemini AI加持,二月发布,能看能懂更智能

    苹果的语音助手Siri,即将迎来其诞生以来最重大的一次变革。最新行业动态指出,苹果计划在二月下旬正式发布由谷歌Gemini人工智能模型驱动的全新Siri版本。这次升级被内部视为Siri首次真正兑现苹果...
    Ai新闻# AI语音助手# Gemini AI# WWDC 2026
    2个月前
    0200
    语音AI独角兽ElevenLabs获80亿美元巨额融资,估值飙升至110亿美元,剑指多模态智能体

    语音AI独角兽ElevenLabs获80亿美元巨额融资,估值飙升至110亿美元,剑指多模态智能体

    一家领先的语音人工智能公司刚刚完成了科技界今年最引人注目的融资之一。市场消息显示,该公司成功筹集了高达80亿美元的新资金,由顶级风险投资机构领投,其投后估值飙升至惊人的110亿美元,这一数字是其今年1...
    Ai新闻# AI智能体# AI融资# ElevenLabs
    1个月前
    0180
    视频暗数据时代终结?前谷歌团队打造AI基础设施,让海量视频资产“开口说话”

    视频暗数据时代终结?前谷歌团队打造AI基础设施,让海量视频资产“开口说话”

    企业服务器中堆积如山的监控录像、历史广播资料和生产视频,正从沉默的“数字化石”转变为可挖掘的“数据金矿”。最新行业动态指出,视频暗数据 (Video Dark Data)——即企业自动收集但从未有效利...
    Ai新闻# AI基础设施# InfiniMind# 企业级AI
    1个月前
    0130
    AI视频独角兽Runway获3.15亿美元融资,估值53亿美元剑指下一代世界模型

    AI视频独角兽Runway获3.15亿美元融资,估值53亿美元剑指下一代世界模型

    在AI视频生成领域掀起技术浪潮的Runway,刚刚完成了一轮足以重塑行业格局的巨额融资。市场消息显示,这家明星初创公司成功筹集了3.15亿美元资金,其估值在短时间内飙升至53亿美元,几乎翻倍。这笔资金...
    Ai新闻# AI独角兽# AI视频生成# Gen 4.5
    1个月前
    0170
    谷歌Gemini应用上线AI音乐生成功能:用文字描述创作30秒歌曲,支持多国语言

    谷歌Gemini应用上线AI音乐生成功能:用文字描述创作30秒歌曲,支持多国语言

    只需一段文字描述,就能让AI为你创作一首包含歌词和封面的完整歌曲。最新行业动态指出,谷歌已为其人工智能助手应用Gemini上线了一项全新的音乐生成功能,该功能基于DeepMind研发的Lyria 3模...
    Ai新闻# AIGC# AI音乐生成# DeepMind
    4周前
    0170
    加载更多
    AI工具导航
    我们将更多的 AI 工具带到你面前。致力于让更多人先看到未来的创作与工作方式。
    Copyright © 2026 AI工具导航 沪ICP备2020026270号-2 
    网址
    网址文章