谷歌发布了其最新的图像生成模型 Nano Banana Pro

Ai新闻5个月前更新 Ivan_Mehta

53 0 0

谷歌正在升级其图像生成模型，新增编辑功能、更高分辨率、更精准的文本渲染能力，并支持联网搜索。

全新图像模型Nano Banana Pro

这款名为Nano Banana Pro的新模型基于本周刚发布的Gemini 3大语言模型构建。谷歌宣称，相比前代Nano Banana，新模型能生成细节更丰富的图像和更精确的文本，并支持多风格字体与多语言文本生成。

谷歌Nano Banana Pro模型生成的图文教程，展示如何制作豆蔻奶茶 — 图片来源：谷歌

该模型还具备网络搜索功能，用户可指令其查询菜谱并生成学习卡片等实用内容。

专业级图像控制能力

谷歌表示Nano Banana Pro专注于为专业人士提供更精细的图像控制，支持调节相机角度、场景光照、景深、焦点及色彩分级等参数。相比Nano Banana最高1024×1024像素的分辨率限制，新模型可生成2K或4K高清图像。

值得注意的是，虽然画质显著提升，但新模型的生成速度较慢且成本更高。原模型每张1024像素图像成本为0.039美元，而新模型1080p/2K图像单张成本达0.139美元，4K图像更升至0.24美元。

高级图像处理特性

新模型支持使用六张高保真参考图进行生成，或在一张图像中融合多达14个对象。它还能保持最多五个人物的一致性特征。谷歌已发布演示应用供用户体验这些功能。

多平台部署策略

Nano Banana Pro正逐步接入谷歌现有AI工具生态：

Gemini应用将默认采用新模型生成图像
免费用户享有限额生成权限，超额后自动切换至原Nano Banana模型
AI Plus/Pro/Ultra订阅用户获得更高生成额度（具体数值未公开）
Notebook LM集成新模型供订阅用户使用

在美国市场，AI Pro/Ultra订阅用户可通过搜索的AI模式调用该模型，Ultra用户还可在视频工具Flow中使用。Workspace客户可在Slides和Vids中体验新功能。

开发者接入渠道

开发者可通过以下方式调用Nano Banana Pro：

Gemini API
Google AI Studio
新一代IDE工具Antigravity

AI内容溯源技术

谷歌正在Gemini应用中集成SynthID数字水印技术，该技术能识别经由谷歌图像模型生成或修改的内容。用户上传图片后，聊天机器人将自动检测图像来源。

目前谷歌未透露是否会支持C2PA等其他AI水印技术标准。

Ai新闻 # Gemini

文章版权归作者所有，未经允许请勿转载。

通义千问广告 - 响应式版

AI模型众测平台Yupp倒闭启示：3300万美元融资难敌产品市场契合度缺失，AI赛道竞争加剧

Ai新闻 # a16z # AI众包 # AI模型测试

2周前

0220

AI算力基建遭遇全球性“急刹车”：纽约州拟立法暂停数据中心建设，能源与税收争议激化

Ai新闻 # AI基础设施 # 可持续AI # 影子电网

2个月前

0240

迪士尼向谷歌发律师函，指控其AI大规模侵权：版权大战如何重塑生成式AI未来？

Ai新闻 # AI版权侵权 # AI训练数据 # Gemini

4个月前

0560

AI巨头砸千万美元狙击前科技高管竞选，美国AI监管战火已烧至国会山

Ai新闻 # AI监管 # AI透明度 # Meta

1个月前