OpenAI推出ChatGPT安全路由系统与家长监护功能

上周末,OpenAI开始在ChatGPT中测试全新的安全路由系统,并于本周一推出了家长控制功能——这些举措引发了用户的褒贬不一的反应。

安全升级的背景

此次安全功能升级源于多起事故:某些ChatGPT模型曾对用户的妄想思维表示认同,而非引导其远离有害对话。其中一桩事件已引发非正常死亡诉讼——一名青少年在与ChatGPT持续互动数月后自杀身亡。

安全路由系统的工作原理

该路由系统能实时检测情绪敏感对话,并在交流过程中自动切换至GPT-5思维模式。OpenAI认为这是处理高风险安全任务的最佳模型。GPT-5系列模型配备了名为“安全补全”的新功能,使其能以安全方式回应敏感问题,而非简单拒绝回答。

与前代模型的差异

这与公司先前设计的讨好型快速应答模型形成鲜明对比。GPT-4o因其过度迎合的特质备受质疑:既可能诱发人工智能导致的妄想症状,又积累了大量忠实用户。今年八月当OpenAI将GPT-5设为默认模型时,众多用户强烈反对并要求保留GPT-4o使用权。

用户与专家的分歧

尽管众多专家和用户对安全功能表示欢迎,但批评者认为实施方案过于谨慎。部分用户指责OpenAI将成人当作儿童对待,导致服务质量下降。对此OpenAI坦言需要时间完善,并设定了120天的迭代改进周期。

官方解读运行机制

ChatGPT应用副总裁尼克·特利通过说明解释路由系统引发的强烈反响:“路由决策基于单条信息执行,从默认模型的切换仅为临时行为。当用户询问时,ChatGPT会告知当前启用模型。这属于全面强化安全防护的举措,旨在通过实际使用经验为大规模推广做好准备。”

家长控制功能的社会反响

家长控制功能同样面临冰火两重天的评价:支持者赞赏其让父母能监管子女使用AI,反对者则担忧这将成为将成人幼儿化的开端。

家长控制的具体功能

控制功能允许家长从四个维度定制青少年账户:设置静默时段、关闭语音模式与记忆功能、禁用图像生成、退出模型训练。青少年账户还将获得额外内容保护(如限制血腥内容与极端审美标准),以及能识别自残倾向的检测系统。

风险干预机制

据OpenAI官方博客透露:“当系统检测到潜在伤害时,经专业培训的团队将介入评估。若出现严重心理危机征兆,除非家长明确拒收,我们将通过邮件、短信及手机推送三重渠道紧急通知家长。”

系统的局限与改进

OpenAI承认系统存在误判可能,但强调“主动预警家长介入胜过保持沉默”。该公司同时表示,当检测到生命威胁且无法联系家长时,正在研发直接通知执法或急救部门的技术方案。

© 版权声明

相关文章

暂无评论

none
暂无评论...