Luma AI

1周前更新 58 0 0

一款能够以文本/图像生成高保真视频并支持自然语言视频编辑与专业 HDR/EXR 工作流的多模态生成平台

收录时间:
2025-09-20

什么是 Luma AI

Luma AI 是一家专注多模态生成式 AI 的公司,使命是“构建能够在物理世界中生成、理解与操作的多模态通用智能”。其旗舰产品组合包括用于视频与图像生成的 Dream Machine、面向专业视频生产的智能视频模型 Ray3、高效率图像模型 Photon,以及面向开发者的 Luma API。这些能力现已在 WebiOS 上可用。

与只依赖文本的传统大模型不同,Luma 的研究路线强调从 视频、音频与语言等丰富多模态数据中联合学习,并在生成过程中强调对物理规律、因果关系与叙事逻辑的把握。这使得其视频与图像生成在 运动一致性、镜头控制、材质光影与角色连贯 等方面具备面向制作管线的可用性。

Luma 早期以移动端 3D Capture 与文本转 3D(Genie)崛起,如今已迭代为覆盖“图像 → 视频 → 视频修改”全流程的创作平台,并提供 API 以嵌入到企业工作流之中。在创意、营销、影视与广告场景,Luma 正从“创意灵感”延伸到“可交付产出”。

🚀 最新进展:

  • 2025-10:发布《Ray3 评测报告》,强调更强的物理一致性、指令遵循与故事性;HDR 工作流成熟。
  • 2025-08Modify with Instructions 上线——用自然语言直接对图像/视频进行“添加/替换/移除/重设风格”等编辑,覆盖对象移除、风格化、虚拟布景与角色细化。
  • 2025-06Modify Video 正式推出;并发布 Modify Video API(视频到视频批量改写)。
  • 2025-05Reframe 上线,支持图像/视频外扩、重排与多平台尺寸适配。
  • 2025-01Ray2 发布,开启新一代视频模型路线;随后 Dream Machine 全面换代与产品重构。

🚀 Luma AI 能做什么 · 主要功能解释

文本生成视频(Text-to-Video,Ray3)

输入自然语言即可生成高保真、运动连贯的短片段。Ray3 强调“可推理的视频”,在镜头语言、物理模拟与场景一致性上优化;原生支持 16-bit HDREXR 帧导出,适配专业调色与合成管线。

图像转视频与参考一致性

基于单张图像生成风格统一的动态镜头,可保持角色面貌、服饰与场景要素的一致性。支持引入 角色参考视觉参考,在不同镜头与场景中复用统一角色与美术语言。

视频到视频改写(Modify / Modify with Instructions)

上传原视频后,通过自然语言指令直接重设风格、对象、环境或镜头元素;无需抠像或动作捕捉即可替换世界、重塑角色或做 VFX 级别的风格化。适用于广告分镜变体、场景替换与创意试验。

Reframe 外扩与多平台适配

对图像/视频进行外扩(Outpaint)、比例重排与方向扩展,以适配社媒竖屏、影院宽银幕或电商横图等多种尺寸;与 Extend/Loop 等生成模式组合,提升成片效率。

草稿模式 + HiFi 毕业(Draft → HiFi)

先用Draft 以更快更省的方式快速探索,再以 HiFi 将优选片段“烘焙”为 4K HDR/EXR 的制作级素材。该两段式流程降低试错成本、提升迭代速度。

镜头与运动控制(Keyframe / Camera Motion / Annotation)

支持起止帧 Keyframe、可学习的镜头运动概念、以及可视化标注(Annotation)。创作者可用最少的提示与圈画标注来精确指定构图、走位与互动,获得可复现的镜头语言。

面向开发者的 Luma API

将文本/图像生成视频、镜头控制、Extend/Loop 与高性能推理能力以 API 形式提供;按用量计费的积分(Credits)体系,适合 SaaS、应用与媒体平台集成。


💡 实用进阶技巧

🎯 角色与风格“参考栈”:为主角准备固定的“角色参考”与若干“视觉参考”,在不同镜头与场景保持人设与美术统一。

Draft→HiFi 两段式:先用 Draft 扫描创意空间与镜头节奏,再对“命中镜头”用 HiFi 输出 4K HDR/EXR,直达后期流程。

🖊️ 可视化标注 + 指令:先用圈画/箭头标注布局与运动,再用自然语言补充风格/材质/光影要求,组合能显著提升指令遵循度。

🧭 Reframe 做多端适配:先为横版叙事定版,再用 Reframe 生成竖屏/方形版本;结合 Extend/Loop 做社媒切片与循环海报。

🛠️ Modify 工作流分层:对“世界/风格/对象”分层下指令(如“只替换背景”“保留光效”),配合强度等级(Adhere/Flex/Reimagine)精准控制改写幅度。


💳 价格套餐与订阅方式

Web 版本套餐与核心差异

方案 月付 年付(约 20% off) 每月积分 核心能力
Free $0 有限 草稿分辨率、非商用、水印、优先级较低
Lite $9.99 $7.99($95.90/年) 3,200 Ray3 访问、4K 升频、非商用、水印
Plus $29.99 $23.99($287.99/年) 10,000 Ray3 + 4K 升频 + HDR、可商用、无水印、较高优先级
Unlimited $94.99 $75.99($911.90/年) 10,000(Fast)+ 放松模式不限量 Ray3 + 4K 升频 + HDR、可商用、无水印、放松模式无限生成
Enterprise 联系销售 20,000(Fast) 最高优先级、可商用、无水印、输入/输出不参与训练

iOS 版本套餐

方案 月付 年付(约 20% off) 每月积分 核心能力
Free $0 250 草稿分辨率、非商用、水印、优先级较低
Lite $12.99 $10.39($124.70/年) 3,200 Ray3 访问、4K 升频,带水印
Plus $37.99 $30.39($364.70/年) 10,000 4K 升频 + HDR、无水印
Unlimited $119.99 $95.99($1151.70/年) 10,000(Fast)+ 放松模式不限量 4K 升频 + HDR、无水印

订阅与管理

iOS:在 App 内点击头像 → Subscription → 闪电图标查看/变更方案;Web:登录账号 → Account SettingsManage Subscription 升降级或取消。升级即时生效,降级在当前计费周期结束后生效。

⚠️ 价格说明:套餐、额度与权益可能因地区/平台与版本更新而变动;商用/水印权利与积分规则以 Luma 官方定价与条款为准,请以官网 Pricing 与 Learning Hub 公告为准。


❓Luma AI 常见问题解答(FAQ)

Q1: Dream Machine 的输入输出与时长/分辨率有什么限制?

A: 标准工作流包含文本转视频、图像转视频与 Modify(视频到视频)改写。常见生成时长为 5s/10s;可输出 SDR/HDR,专业流程可导出 EXR 帧序列以便调色与合成。不同模型/分辨率的积分消耗不同,详见官方积分矩阵与计划功能表。

Q2: 什么是 Draft 与 HiFi?何时使用?

A: Draft 用于快速、低成本地探索镜头与节奏;确定“命中镜头”后用 HiFi 将片段“毕业”为 4K HDR/EXR 的可交付素材。该流程将“想法密集探索”与“高质量产出”解耦,提高整体效率。

Q3: Modify with Instructions 如何工作?

A: 你可以直接用自然语言(如“把球体换成棒球,并保留原始光照”)对视频进行编辑;也可替换/编辑 Start Frame 作为改写依据。当前支持 最长 10 秒、≤100MB、.mp4/.mov 的输入,并提供 Adhere/Flex/Reimagine 三档强度用于控制改写幅度。

Q4: 是否支持商业使用?水印规则如何?

A: Plus/Unlimited/Enterprise 方案生成内容可商业使用且无水印;Free/Lite 为个人非商用且带水印(即使升级,旧内容的水印与非商用属性不变)。不同方案在授权与内容使用权上存在差异,请以官方“User Rights & Licensing”说明为准。

Q5: 订阅取消或降级后,我的商业权利会丢失吗?

A: 不会。你在 付费可商用方案期间生成的内容,其商业使用权永久归属该内容,即使你后来取消或降级,之前内容的商用权仍保留。

Q6: Dream Machine 是否有 Android 客户端?

A: 目前提供 WebiOS 版本;Android 应用尚未提供。你可以通过网页端在任何平台使用核心功能。

Q7: Luma API 会使用我的数据训练吗?

A: 官方说明为:除非你明确选择加入,你提供的输入与生成的输出不会用于训练。API 采用积分计费,并提供 Build/Scale 等不同级别的速率与支持。

Q8: 积分(Credits)如何估算成本?

A: 不同模型/分辨率/动态范围对应不同积分消耗(如 Ray2 720p 5s ≈160 积分;Ray3 HDR/EXR 成本更高)。Unlimited/Enterprise 方案在“放松模式(Relaxed)”可不限量生成,Fast 积分用尽后自动切换。

相关导航

暂无评论

none
暂无评论...