谷歌发布了其最新的图像生成模型 Nano Banana Pro

谷歌正在升级其图像生成模型,新增编辑功能、更高分辨率、更精准的文本渲染能力,并支持联网搜索。

全新图像模型Nano Banana Pro

这款名为Nano Banana Pro的新模型基于本周刚发布的Gemini 3大语言模型构建。谷歌宣称,相比前代Nano Banana,新模型能生成细节更丰富的图像和更精确的文本,并支持多风格字体与多语言文本生成。

谷歌Nano Banana Pro模型生成的图文教程,展示如何制作豆蔻奶茶
图片来源:谷歌

该模型还具备网络搜索功能,用户可指令其查询菜谱并生成学习卡片等实用内容。

专业级图像控制能力

谷歌表示Nano Banana Pro专注于为专业人士提供更精细的图像控制,支持调节相机角度、场景光照、景深、焦点及色彩分级等参数。相比Nano Banana最高1024×1024像素的分辨率限制,新模型可生成2K或4K高清图像。

值得注意的是,虽然画质显著提升,但新模型的生成速度较慢且成本更高。原模型每张1024像素图像成本为0.039美元,而新模型1080p/2K图像单张成本达0.139美元,4K图像更升至0.24美元。

图片来源:谷歌

高级图像处理特性

新模型支持使用六张高保真参考图进行生成,或在一张图像中融合多达14个对象。它还能保持最多五个人物的一致性特征。谷歌已发布演示应用供用户体验这些功能。

多平台部署策略

Nano Banana Pro正逐步接入谷歌现有AI工具生态:

  • Gemini应用将默认采用新模型生成图像
  • 免费用户享有限额生成权限,超额后自动切换至原Nano Banana模型
  • AI Plus/Pro/Ultra订阅用户获得更高生成额度(具体数值未公开)
  • Notebook LM集成新模型供订阅用户使用

在美国市场,AI Pro/Ultra订阅用户可通过搜索的AI模式调用该模型,Ultra用户还可在视频工具Flow中使用。Workspace客户可在Slides和Vids中体验新功能。

开发者接入渠道

开发者可通过以下方式调用Nano Banana Pro:

  1. Gemini API
  2. Google AI Studio
  3. 新一代IDE工具Antigravity

AI内容溯源技术

谷歌正在Gemini应用中集成SynthID数字水印技术,该技术能识别经由谷歌图像模型生成或修改的内容。用户上传图片后,聊天机器人将自动检测图像来源。

目前谷歌未透露是否会支持C2PA等其他AI水印技术标准。

© 版权声明

相关文章

暂无评论

none
暂无评论...