OpenAI增强开发者支持 API推出更强大模型

周一在开发者日活动中,OpenAI发布了多项API更新,推出最新大语言模型GPT-5 Pro、新一代视频生成模型Sora 2,以及一款更小巧经济的语音模型。

开发生态系统升级

这些更新旨在吸引开发者加入OpenAI生态系统,包括推出智能体构建工具和允许在ChatGPT内直接开发应用的功能。

GPT-5 Pro:面向专业领域

GPT-5 Pro将特别吸引金融、法律和医疗保健领域的应用开发者。OpenAI首席执行官Sam Altman指出,这些行业需要“极高的准确性和深度推理能力”。

语音交互的未来布局

Altman强调语音功能正迅速成为人机交互的主要方式之一。为此,OpenAI推出“gpt-realtime mini”语音模型——这款通过API提供的语音模型体积更小、成本更低,支持低延迟音频流交互。虽然价格比前代高端语音模型降低70%,但承诺保持“同等级别的语音质量和表现力”。

Sora 2:视频生成新突破

OpenAI开发者生态成员现可通过API预览版使用Sora 2视频生成模型。该模型上周与Sora应用同步发布,这款对标TikTok的应用充斥着AI生成的短视频。用户可通过文字指令生成自己、朋友或任何主题的视频,并在算法推荐流中分享。

“开发者现在可以直接在自家应用中调用驱动Sora 2惊人视频效果的同等模型。”Altman表示。

技术升级亮点

Sora 2在前代基础上实现多重突破:

  • 生成更真实且物理一致性更强的场景
  • 支持音画同步
  • 提供更精细的创作控制——从详细的运镜指导到风格化视觉效果

创新应用场景

Altman演示道:“例如,你可以拍摄iPhone视角的画面,然后指示Sora将其扩展成电影般的广角镜头。但我们最兴奋的突破在于新模型实现了音画完美融合——不仅是语音,还包括丰富的环境音效和与视觉内容同步的声效设计。”

Sora 2被定位为概念开发工具,其应用场景包括:

  • 根据产品整体调性为广告创作视觉初稿
  • 助力美泰设计师将草图转化为玩具概念

Altman在开发者日展示的美泰案例,揭示了OpenAI正与芭比制造商合作,将生成式AI引入玩具制造流程的战略布局。

© 版权声明

相关文章

暂无评论

none
暂无评论...