谷歌Vids重大更新:文本指令驱动AI数字人,视频创作进入“导演模式”

视频创作的门槛正在被AI技术彻底抹平。最新行业动态指出,谷歌旗下的AI视频编辑应用Vids迎来一系列重磅功能升级,其中最引人注目的是用户现在可以通过自然语言文本指令 (Text Prompts)直接“导演”AI数字人(Avatar)在场景中的表演,这标志着视频制作从繁琐的剪辑迈向了直观的“指令驱动”时代。

AI导演登场:用文字指令操控数字人表演

市场消息显示,此次更新的核心在于赋予了用户前所未有的控制力。在Vids应用中,用户只需输入如“让这位销售代表拿起产品并向镜头微笑”或“让工程师在实验室里操作设备”这样的自然语言描述,AI数字人就能根据指令完成相应的动作和互动。这不仅限于简单的站立和说话,更可以与产品、道具或设备进行复杂的交互,极大丰富了视频内容的动态表现力。

尽管输出动作多样,但该公司强调其技术能确保角色一致性 (Character Consistency),即同一数字人在不同场景和指令下能保持外观、风格和行为的连贯性,这对于品牌宣传或系列教程视频至关重要。此外,用户还能根据视频主题,通过提示词进一步定制角色的外观、更换服装,甚至生成全新的背景场景。

技术底座全面升级:从Veo 3.1YouTube一键发布

此次更新并非孤立功能,而是谷歌AI视频生成能力的一次集中整合。就在上月,谷歌刚刚为Vids集成了Lyria 3系列音乐生成模型。本次,更强大的Veo 3.1视频生成模型也被引入。该模型能在编辑工具内部直接生成最长8秒的高质量视频片段,为内容创作提供了丰富的素材库。据悉,所有用户每月可获得10次免费生成额度,而高阶AI订阅用户每月甚至可生成多达1000个Veo视频。

另一个提升工作流效率的功能是直接导出至YouTube。用户完成视频编辑后,无需经历下载、再上传的繁琐步骤,即可一键将成品视频发布到自己的YouTube频道,且默认设置为私密状态,便于最终审核。

同时,谷歌还为Vids套件新增了一款Chrome浏览器扩展程序,支持带音频的屏幕录制,方便用户快速捕获教程、演示或任何屏幕活动作为视频素材。

从企业工具到大众创作平台的野心

回顾Vids的发展路径,其战略意图清晰可见。该产品于2024年首次亮相时,主要定位是服务企业内容创作。随后,谷歌通过引入AI数字人、扩展至消费者市场、增加2D/3D卡通风格头像以及支持多国语言配音(包括法语、德语、日语等)等一系列更新,不断降低其使用门槛。

此次通过文本指令驱动数字人的功能,直接瞄准了当前AI视频赛道的核心竞争点。市场上,诸如Synthesia、HeyGen等专注于AI数字人视频生成的初创公司已获得不少关注。谷歌Vids的此次升级,意味着其正将分散的AI能力——数字人生成、视频生成、音乐生成、智能剪辑——整合进一个统一、易用的工作流中,构建起强大的竞争壁垒。

行业影响与未来展望

本次更新远不止是功能叠加,它预示着视频内容生产范式的转变。对于中小型企业、教育工作者、自媒体创作者乃至普通用户而言,专业级视频内容的制作成本和时间正被急剧压缩。能够用自然语言“指导”AI演员,使得视频脚本直接转化为可视化内容成为可能,创意与执行之间的鸿沟被大幅缩小。

从行业角度看,谷歌正利用其在大语言模型 (LLM)、多模态AI和云基础设施方面的综合优势,加速推进AI在创意工具领域的普及。这不仅是与专业视频软件竞争,更是在开拓一个全新的“描述即创作”的市场。未来,视频编辑的核心技能可能会从操作复杂的时间轴,转向如何撰写精准、富有创意的AI指令。随着AI生成视频的时长、一致性和可控性持续提升,视频作为主流信息载体的地位将更加巩固,而每个人成为“导演”的门槛,正在消失。

© 版权声明
通义千问广告 - 响应式版
通义千问大模型 免费资源包
7000万tokens 免费领!
额外赠送25%折扣卷
去官网领取优惠

相关文章

暂无评论

none
暂无评论...