答非所问…OpenAI称“将持续公开AI模型安全性评估”

by Kim Minyoung

Published 15 May.2025 06:58(KST)

Updated 15 May.2025 09:02(KST)

open/close

AI安全性评估结果在官网公开

ChatGPT开发商OpenAI于当地时间14日表示，已公开名为“安全性评估枢纽（Safety Evaluations Hub）”的网页，在该页面上发布自家人工智能模型的安全性评估结果。

在这一网页中，OpenAI公开了其人工智能模型在有害内容生成、越狱（jailbreak·绕过安全装置生成受限内容）、幻觉（hallucination）等各类测试中获得的评分。

OpenAI称：“这一枢纽是我们加强透明度努力的一部分”，“我们将持续共享相关指标，并在每次有重要更新时进行刷新。”

OpenAI还补充表示：“通过在这一枢纽中公开部分安全性评估结果，用户可以更容易理解OpenAI系统在安全性方面的表现，同时也能支持整个行业提升透明度的努力。”

OpenAI之所以强化人工智能模型的透明度，是因为近期围绕部分模型出现了争议。

信息技术（IT）专业媒体TechCrunch指出，过去几个月里，OpenAI对部分代表性模型仓促进行安全性测试，却未就其他模型公开技术报告。

此外，自从3月末ChatGPT基础模型GPT-4o更新后，用户不满情绪不断累积，OpenAI最近甚至全面取消了该次更新。

据称，GPT-4o更新后，ChatGPT被调整为更多地对用户的提问或发言进行称赞或附和，但有时会出现与语境或情境不符的回应。

OpenAI首席执行官（CEO）Sam Altman也于上月28日通过X（X·原Twitter）承认了这一问题，并通过官方博客预告了后续措施。

本报道由人工智能(AI)翻译技术生成。