Stable Diffusion

1个月前更新 33 0 0

Stability AI 出品的一款能够将文本/草图等转为高质量图像并提供专业编辑与超分流程的生成式视觉产品

所在地:
美国
收录时间:
2025-10-02
Stable DiffusionStable Diffusion

什么是 Stable Diffusion

Stable Diffusion 是 Stability AI 联合学术与产业伙伴推出的开源文本生成图像(Text-to-Image)模型家族,自 2022 年 8 月公开发布以来快速演进,形成了从 SD 1.x/2.x、SDXL 到最新 SD 3.5 的完整谱系。当前官方以“Stable Image”作为统一入口,面向个人创作、开发者与企业提供生成与编辑能力、API 与自托管授权等多种形态的产品化体验。

从产品定位上看,Stable Diffusion 兼顾“开放可定制”与“生产级质量”。SD 3.5 系列覆盖 Large / Large Turbo / Medium,不仅在提示词理解与画质上持续优化,也强调在消费级硬件上的可运行性与微调扩展性,配合稳定的 API 计费与网页端 Stable Assistant,形成从创意草图到成品交付的一站式工作流。

核心技术方面,Stable Diffusion 采用扩散模型与潜空间生成(Latent Diffusion)路线。SDXL 引入“Base + Refiner”的专家混合流水线;SDXL Turbo 通过 Adversarial Diffusion Distillation 将采样步数压缩至「一步级」;SD 3.5 在架构上进一步采用 MMDiT-X 与 Query-Key Normalization 等训练与稳定化技巧,提升可微调性与推理效率,为不同显存与场景下的部署提供了技术基础。

总体演化来看,Stable Diffusion 已从最初的开源研究模型成长为“模型 + 工具 + 平台 + 授权”的生态:模型家族覆盖从快速迭代到高质量生产的广谱需求,工具链覆盖编辑、控制与超分辨工作流,平台层提供 API/云与自托管部署,授权层通过 Community License 与商用许可覆盖个人、小微到企业客户。

🚀 最新进展:
• 2024-10-22:SD 3.5 正式发布,包含 Large、Large Turbo,10-29 增补 Medium 版本;Large 参数量约 81 亿,Medium 约 25 亿,并强调“多数用例免费商用(年营收<$1M)”的社区许可。
• 2025-07-09:官方 API 价格与服务更新:SD 1.6 API 将于 7-24 停止;建议迁移至 SDXL/Stable Image Core 或 Ultra;同时公布编辑、控制、超分等按“credits”计费的新价表(8-01 生效)。
• 2025-08:与 AMD 合作发布 SD 3/3.5 Medium 的本地 NPU 优化方案,支持在 Ryzen AI XDNA 2 平台离线生成,面向隐私与低时延场景。
• Stable Assistant 网页端订阅更新:提供 Standard/Pro/Plus/Premium(支持 USD/EUR/GBP/JPY),含 3 天免费试用与按次扣点。

🚀 Stable Diffusion 能做什么 · 主要功能解释

1) 高质量文本生图(SD 3.5 家族)

SD 3.5 在提示词贴合度(Prompt Adherence)、风格覆盖与人物/场景多样性上显著提升。Large 面向 1MP 级专业输出,Large Turbo 将高质量生成压缩到约 4 步采样,Medium 以更低显存(≈9.9GB/不含文本编码器)实现 0.25–2MP 范围的高效生成,适合消费级 GPU 与大规模微调/LoRA 管线。

2) 极速创意迭代(Turbo / Distillation)

SDXL Turbo 通过 Adversarial Diffusion Distillation,将生成步数降至“一步级”,适合实时预览、交互改稿与A/B风格探索;SD 3.5 Large Turbo 在保持贴合度与画质的同时显著提速,适合从“草图—>方案—>成品”的渐进式流程。

3) 专业编辑工作流(Edit/Inpaint/Outpaint/背景处理)

官方“Image editing services”覆盖:目标擦除、局部修复(Inpaint)、扩图(Outpaint)、抠图去背、搜索与重着色、替换背景与重打光等,构成从合成到后期的端到端能力,能与品牌视觉、商品精修与人像电商等流程衔接。

4) 结构与风格控制(Control/Sketch/Structure/Style)

内建 Control 工具支持以草图/线稿/结构图引导生成,或基于参考图抽取风格/结构,实现“构图不变、风格可变”或“风格统一、内容更新”的可控生成,适合角色一致性、分镜/漫画、产品多色多视图等工业化产出。

5) 超分与质量增强(Upscale:Creative/Conservative/Fast)

官方提供三档超分策略,分别面向创意细节增强、保守无损放大与极速出图;新版 API 价格采用 credits 记费(如 Fast 2 credits、Conservative 40、Creative 60),便于按需控制成本与交付尺寸。

6) 一体化平台与多端部署

Stable Diffusion 可通过三种路径使用:Stable Assistant 网页端(含订阅与点数)、平台 API(面向应用/后端集成、支持 Core/Ultra/SD 3.5 等)、自托管商业许可(本地/私有化部署,可深度定制与数据隔离),并提供云合作伙伴生态打通企业现有基础设施。

7) 模型谱系与可定制性

除 SD 3.5 外,SDXL(3.5B 参数)仍是高分辨率、照片写实的重要基座;其 Base+Refiner 的“专家流水线”与开源生态(Hugging Face 权重与推理代码)有利于二次开发、LoRA 训练与行业化落地。


💡 Stable Diffusion 的实用进阶技巧

🎯 提示词层次化:按“主体→风格→镜头/光效→材质→后期参数”分段书写,并用逗号/分号隔离要点,能显著提升贴合度与稳定性。

Turbo 做草稿,Large 出成片:先用 Large Turbo/SDXL Turbo 快速迭代方向,确认后改用 Large/SDXL + Creative Upscale 做终稿与层次增强。

🧩 Control 保构图,LoRA 保风格:草图/结构控制保持布局一致,配合风格/角色 LoRA 与固定 seed,实现多图一致性与系列化创作。

🪄 “编辑优先”的后期链路:复杂合成尽量拆解为“生成基础图 → Inpaint 局部修复 → 替换背景与重打光 → Creative 超分”四段,减少一次性大改带来的伪影。

🖥️ 本地/云混合:中小显存先用 Medium/XL 预生成与草稿,在云端用 Large/Ultra/高档 Upscale 做最终放大与商用交付,成本与时延更可控。


💳 价格套餐与订阅方式

各版本价格与功能差异(2025-08-01 后生效的官方口径)

方案 价格 额度 / 计费 核心功能 / 说明
Stable Assistant · Standard $9/月(或 $90/年) 每月 900 credits 网页端对话式生图与编辑,含 3 天试用;支持 USD/EUR/GBP/JPY
Stable Assistant · Pro $19/月(或 $190/年) 每月 1900 credits 更高月度额度,适合中度创作与小团队协作
Stable Assistant · Plus $49/月(或 $490/年) 每月 5500 credits 重度使用者/商用图像产出
Stable Assistant · Premium $99/月(或 $990/年) 每月 12000 credits 企业/工作室级别配额
平台 API(Stable Image) 按 credits 计费(1 credit = $0.01) 示例:Edit/Control 单次约 5 credits;Upscale Fast 2 / Conservative 40 / Creative 60 适合把生图/编辑嵌入应用后端;模型含 Core/Ultra/SD 3.5 家族
自托管商业许可 定制(联系销售) 按部署规模/用途定价 本地化/私有云部署;更强的合规与可定制性

订阅与购买方式

通过官网开通 Stable Assistant(支持多币种与 3 天试用),或注册开发者账户使用平台 API(按 credits 扣费)。企业可联系销售获取自托管/商用授权与批量折扣。

⚠️ 价格说明:API 与订阅价格会随模型与基础设施更新而调整;2025-08-01 起的新价表已生效,具体以官方页面为准。


❓Stable Diffusion 常见问题解答(FAQ)

Q1: 我该选 SDXL 还是 SD 3.5?

A: 需要更高贴合度与专业质感、以及 1MP 级成片时选 SD 3.5 Large;追求速度与迭代效率选 Large Turbo/SDXL Turbo;在本地显存受限(≈10GB)或强调可定制性时选 SD 3.5 Medium 或 SDXL 作为基座。

Q2: Stable Diffusion 是否可以免费商用?

A: 官方“Community License”允许个人/组织在年度营收<$1,000,000 时免费商用;超过门槛需登记并洽谈商业许可。输出作品的所有权归用户(在适用法律允许范围内)。

Q3: API 的 credits 如何理解与估算成本?

A: 平台按功能扣点,例如 Edit/Control 常见操作约 5 credits/次,Upscale Fast 2、Conservative 40、Creative 60;credits 与美元挂钩(1 credit = $0.01),可据此预估批量成本。

Q4: Stable Assistant 与 API 的区别?

A: Assistant 是网页端“对话式”工作台,适合非工程角色快速出图与编辑;API 面向开发/集成,可将生图、编辑、控制、超分嵌入自有产品或自动化流程。

Q5: 如何实现角色/风格一致性?

A: 推荐固定 seed + 结构控制(Sketch/Structure)保构图一致;结合风格/角色 LoRA 做外观统一;在最后用 Creative Upscale 做细节与锐化统一。

Q6: 是否支持本地与离线生成?

A: 可通过自托管许可在本地/私有环境部署;同时 SD 3/3.5 Medium 已有针对 AMD Ryzen AI XDNA 2 NPU 的离线优化方案,适合隐私与低时延场景。

Q7: 图片分辨率与纵横比如何设定?

A: SD 3.5 Large 面向约 1MP 输出;Medium 支持 0.25–2MP 生成。建议按目标投放与印刷需求在出图后再用 Upscale 提升至 2K/4K,避免一次性高分导致伪影累积。

Q8: 开源权重在哪里获取?

A: 官方提供在 Hugging Face 的权重下载与 GitHub 推理代码,便于微调、扩展与集成;请遵守 Community License 与 Acceptable Use Policy。

Q9: 从 SD 1.5/1.6 或 SDXL 迁移到 SD 3.5 有何建议?

A: 对插件/后端先切换到 Stable Image Core/Ultra 或直接调用 SD 3.5;对提示词适当精细化与结构化;对工作流引入官方 Edit/Control/Upcale 能力替代旧有第三方脚本。

Q10: 版权与合规需要注意什么?

A: 使用与分发需遵守 Community License 与 AUP;输出所有权归用户,但不得用于违法或受限场景。对训练数据与商标等争议,请关注官方法律与政策更新,确保素材来源与用途合规。

相关导航

暂无评论

none
暂无评论...