只需一段文字描述,就能让AI为你创作一首包含歌词和封面的完整歌曲。最新行业动态指出,谷歌已为其人工智能助手应用Gemini上线了一项全新的音乐生成功能,该功能基于DeepMind研发的Lyria 3模型,目前正向全球成年用户逐步开放。
从文字到音乐:Gemini的创作流程与核心功能
这项新功能的使用方式极为直观:用户只需在Gemini应用中用自然语言描述想要的歌曲主题、风格或情绪,AI便能生成一段时长30秒的音频,并同步创作歌词和由Nano Banana模型生成的封面艺术。例如,用户可以要求生成一首“关于一只袜子找到另一半的滑稽R&B慢板歌曲”。
更值得注意的是,该功能支持多模态输入。用户可以直接上传一张照片或一段视频,AI会分析其内容与氛围,并据此创作一首匹配的歌曲。在生成过程中,用户还能对风格、人声、节奏等音乐元素进行细粒度调整和控制。
技术内核:Lyria 3模型与行业应用扩展
此次驱动功能的Lyria 3模型,是谷歌DeepMind在AI音乐生成领域的最新成果。市场消息显示,相比前代模型,Lyria 3在生成音乐的真实感、复杂度和丰富性上均有显著提升。
除了集成到Gemini应用,谷歌同时宣布将Lyria 3模型通过Dream Track功能提供给全球的YouTube创作者使用,帮助他们快速生成AI配乐。此前,该功能仅限美国地区的创作者使用。
版权保护与内容识别:AI生成音乐的“水印”机制
面对AI生成内容(AIGC)日益突出的版权和溯源问题,谷歌在官方文件中披露了相应的保障措施。公司强调,Lyria 3的设计初衷是“用于原创表达,而非模仿现有艺术家”。如果用户的提示词中包含特定艺人姓名,AI会将其视为宽泛的创作灵感,生成风格或情绪相似的作品,而非直接复制。系统还内置了过滤器,用于检查输出内容是否与现有版权作品过于相似。
更为关键的是,所有由Lyria 3生成的歌曲都将嵌入一个不可见的SynthID数字水印,用于标识其AI生成属性。此外,Gemini应用内也将新增识别功能,允许用户上传任意音频文件,由AI判断其是否由Lyria 3生成。
行业影响与未来展望:机遇与挑战并存
此次功能更新,标志着主流AI助手正从单纯的文本和图像交互,向更复杂的创意内容生成(Creative Content Generation)领域深入。这无疑降低了音乐创作的门槛,为普通用户和内容创作者提供了强大的工具。
然而,AI生成音乐的普及也伴随着持续的行业争议。一方面,如YouTube、Spotify等平台正积极与唱片公司合作,探索AI音乐的商业化路径;另一方面,多家AI公司正因训练数据版权问题面临音乐行业的诉讼。为此,一些流媒体平台如Deezer已开始部署工具来标记AI生成音乐,以遏制欺诈性流量。
谷歌Gemini此次的谨慎布局——包括严格的版权过滤、强制水印和内容识别工具——可被视为在推动技术创新的同时,试图回应行业关切的平衡之举。AI音乐生成的未来,将在技术能力、创作自由与版权伦理的持续博弈中展开。