OpenAI增强开发者支持 API推出更强大模型

周一在开发者日活动中，OpenAI发布了多项API更新，推出最新大语言模型GPT-5 Pro、新一代视频生成模型Sora 2，以及一款更小巧经济的语音模型。

开发生态系统升级

这些更新旨在吸引开发者加入OpenAI生态系统，包括推出智能体构建工具和允许在ChatGPT内直接开发应用的功能。

GPT-5 Pro：面向专业领域

GPT-5 Pro将特别吸引金融、法律和医疗保健领域的应用开发者。OpenAI首席执行官Sam Altman指出，这些行业需要“极高的准确性和深度推理能力”。

语音交互的未来布局

Altman强调语音功能正迅速成为人机交互的主要方式之一。为此，OpenAI推出“gpt-realtime mini”语音模型——这款通过API提供的语音模型体积更小、成本更低，支持低延迟音频流交互。虽然价格比前代高端语音模型降低70%，但承诺保持“同等级别的语音质量和表现力”。

Sora 2：视频生成新突破

OpenAI开发者生态成员现可通过API预览版使用Sora 2视频生成模型。该模型上周与Sora应用同步发布，这款对标TikTok的应用充斥着AI生成的短视频。用户可通过文字指令生成自己、朋友或任何主题的视频，并在算法推荐流中分享。

“开发者现在可以直接在自家应用中调用驱动Sora 2惊人视频效果的同等模型。”Altman表示。

技术升级亮点

Sora 2在前代基础上实现多重突破：

生成更真实且物理一致性更强的场景
支持音画同步
提供更精细的创作控制——从详细的运镜指导到风格化视觉效果

创新应用场景

Altman演示道：“例如，你可以拍摄iPhone视角的画面，然后指示Sora将其扩展成电影般的广角镜头。但我们最兴奋的突破在于新模型实现了音画完美融合——不仅是语音，还包括丰富的环境音效和与视觉内容同步的声效设计。”

Sora 2被定位为概念开发工具，其应用场景包括：

根据产品整体调性为广告创作视觉初稿
助力美泰设计师将草图转化为玩具概念

Altman在开发者日展示的美泰案例，揭示了OpenAI正与芭比制造商合作，将生成式AI引入玩具制造流程的战略布局。

Ai新闻 # GPT-5 # Sora

文章版权归作者所有，未经允许请勿转载。

通义千问广告 - 响应式版

AI数据效率革命：新锐实验室Flapping Airplanes获1.8亿美元种子轮，挑战大模型训练范式

Ai新闻 # AGI # AI实验室 # AI研究

3周前

090

新谷歌联手运营商在印度狙击RCS垃圾信息，能否重塑富媒体通信信任？

Ai新闻 # Android生态系统 # Google Messages # RCS

6天前

080

Zendesk称其新型人工智能客服能解决80%的客户支持问题

Ai新闻

5个月前

0560

这家分布式数据存储初创企业欲挑战大型云服务商