谷歌Gemini应用上线AI音乐生成功能：用文字描述创作30秒歌曲，支持多国语言

只需一段文字描述，就能让AI为你创作一首包含歌词和封面的完整歌曲。最新行业动态指出，谷歌已为其人工智能助手应用Gemini上线了一项全新的音乐生成功能，该功能基于DeepMind研发的Lyria 3模型，目前正向全球成年用户逐步开放。

从文字到音乐：Gemini的创作流程与核心功能

这项新功能的使用方式极为直观：用户只需在Gemini应用中用自然语言描述想要的歌曲主题、风格或情绪，AI便能生成一段时长30秒的音频，并同步创作歌词和由Nano Banana模型生成的封面艺术。例如，用户可以要求生成一首“关于一只袜子找到另一半的滑稽R&B慢板歌曲”。

更值得注意的是，该功能支持多模态输入。用户可以直接上传一张照片或一段视频，AI会分析其内容与氛围，并据此创作一首匹配的歌曲。在生成过程中，用户还能对风格、人声、节奏等音乐元素进行细粒度调整和控制。

技术内核：Lyria 3模型与行业应用扩展

此次驱动功能的Lyria 3模型，是谷歌DeepMind在AI音乐生成领域的最新成果。市场消息显示，相比前代模型，Lyria 3在生成音乐的真实感、复杂度和丰富性上均有显著提升。

除了集成到Gemini应用，谷歌同时宣布将Lyria 3模型通过Dream Track功能提供给全球的YouTube创作者使用，帮助他们快速生成AI配乐。此前，该功能仅限美国地区的创作者使用。

版权保护与内容识别：AI生成音乐的“水印”机制

面对AI生成内容（AIGC）日益突出的版权和溯源问题，谷歌在官方文件中披露了相应的保障措施。公司强调，Lyria 3的设计初衷是“用于原创表达，而非模仿现有艺术家”。如果用户的提示词中包含特定艺人姓名，AI会将其视为宽泛的创作灵感，生成风格或情绪相似的作品，而非直接复制。系统还内置了过滤器，用于检查输出内容是否与现有版权作品过于相似。

更为关键的是，所有由Lyria 3生成的歌曲都将嵌入一个不可见的SynthID数字水印，用于标识其AI生成属性。此外，Gemini应用内也将新增识别功能，允许用户上传任意音频文件，由AI判断其是否由Lyria 3生成。