品玩6月28日讯,据arsTechnica 报道,OpenAI 的研究人员发布了 CriticGPT,这是一个新的人工智能模型,旨在识别 ChatGPT 生成的代码中的错误。
CriticGPT旨在通过从人类反馈中强化学习(RLHF)来提高人工智能系统的行为符合人类期望的过程(称为 "对齐"),从而帮助人类审查员使大型语言模型(LLM)的输出更加准确。
OpenAI 计划将类似 CriticGPT 的模型集成到其 RLHF 标签管道中,为其培训师提供人工智能协助。对 OpenAI 来说,这是朝着开发更好的工具迈出的一步,这些工具可用于评估 LLM 系统的输出结果,如果没有额外的支持,人类可能很难对这些结果进行评分。
