CriticGPT:OpenAI 引入 ML 模型来审查 ChatGPT 响应

机器学习对机器学习结果进行检查和批评,以便能够在未来向使用机器学习的人提供更好的机器学习结果。换句话说,Cha…

机器学习对机器学习结果进行检查和批评,以便能够在未来向使用机器学习的人提供更好的机器学习结果。换句话说,ChatGPT 的创建者 OpenAI 开发了一种名为 CriticGPT 的新模型,该模型基于 GPT-4 并经过训练以检测 ChatGPT 代码输出中的错误。至少根据新闻稿,CriticGPT 支持据说可以帮助用户检测错误的效率比没有它时提高 60%。 GPT-4 为 ChatGPT 提供支持,旨在通过 RLHF 发挥作用并进行交互。 RHLF 是什么意思?强化 –人类反馈学习(RLHF) – 使用人类反馈优化您的 AI 模型,使它们能够更有效地学习。

CriticGPT 旨在通过批评突出 ChatGPT 答案中的不准确之处。然而,OpenAI 继续表示,CriticGPT 的建议并不总是正确的。这个概念今天仍然有用。该公司还解释了为什么该系统仍远未完善。 CriticGPT 是根据相当短的 ChatGPT 答案进行训练的,但未来的模型可能需要理解更长、更复杂的任务。当任务或答案非常复杂时,CriticGPT 目前会遇到问题,因为我们目前无法解决分布在答案许多部分的错误。