推荐7*24快讯
OpenAI推出“安全评估中心”,定期公布模型安全性能数据
区小号 5月15日消息,据OpenAI官方公告,为提高模型安全透明度,OpenAI宣布上线“安全评估中心”(Safety Evaluations Hub),用于持续发布旗下模型在有害内容、越狱攻击、幻觉生成、指令优先级等方面的安全表现结果。相较于系统卡片只在模型发布时披露一次性数据,该中心将随模型更新周期性更新,支持不同模型间横向比较,旨在提升社区对AI安全性的理解与监管透明度。目前,GPT-4.5与GPT-4o在越狱攻击抵抗与事实准确性方面表现最为出色。
本文来自投稿,不代表本站立场,如若转载,请注明出处:https://www.quxiaohao.com/7_24kuaixun/150166.html