答非所问…OpenAI称“将持续公开AI模型安全性评估”
AI安全性评估结果在官网公开
ChatGPT开发商OpenAI于当地时间14日表示,已公开名为“安全性评估枢纽(Safety Evaluations Hub)”的网页,在该页面上发布自家人工智能模型的安全性评估结果。
在这一网页中,OpenAI公开了其人工智能模型在有害内容生成、越狱(jailbreak·绕过安全装置生成受限内容)、幻觉(hallucination)等各类测试中获得的评分。
OpenAI称:“这一枢纽是我们加强透明度努力的一部分”,“我们将持续共享相关指标,并在每次有重要更新时进行刷新。”
OpenAI还补充表示:“通过在这一枢纽中公开部分安全性评估结果,用户可以更容易理解OpenAI系统在安全性方面的表现,同时也能支持整个行业提升透明度的努力。”
OpenAI之所以强化人工智能模型的透明度,是因为近期围绕部分模型出现了争议。
信息技术(IT)专业媒体TechCrunch指出,过去几个月里,OpenAI对部分代表性模型仓促进行安全性测试,却未就其他模型公开技术报告。
此外,自从3月末ChatGPT基础模型GPT-4o更新后,用户不满情绪不断累积,OpenAI最近甚至全面取消了该次更新。
据称,GPT-4o更新后,ChatGPT被调整为更多地对用户的提问或发言进行称赞或附和,但有时会出现与语境或情境不符的回应。
OpenAI首席执行官(CEO)Sam Altman也于上月28日通过X(X·原Twitter)承认了这一问题,并通过官方博客预告了后续措施。
本报道由人工智能(AI)翻译技术生成。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。