CriticGPT：OpenAI 引入 ML 模型来审查 ChatGPT 响应

机器学习对机器学习结果进行检查和批评，以便能够在未来向使用机器学习的人提供更好的机器学习结果。换句话说，ChatGPT 的创建者 OpenAI 开发了一种名为 CriticGPT 的新模型，该模型基于 GPT-4 并经过训练以检测 ChatGPT 代码输出中的错误。至少根据新闻稿，CriticGPT 支持据说可以帮助用户检测错误的效率比没有它时提高 60%。 GPT-4 为 ChatGPT 提供支持，旨在通过 RLHF 发挥作用并进行交互。 RHLF 是什么意思?强化 –从人类反馈中学习(RLHF) – 使用人类反馈优化您的 AI 模型，使它们能够更有效地学习。

CriticGPT 旨在通过批评突出 ChatGPT 答案中的不准确之处。然而，OpenAI 继续表示，CriticGPT 的建议并不总是正确的。这个概念今天仍然有用。该公司还解释了为什么该系统仍远未完善。 CriticGPT 是根据相当短的 ChatGPT 答案进行训练的，但未来的模型可能需要理解更长、更复杂的任务。当任务或答案非常复杂时，CriticGPT 目前会遇到问题，因为我们目前无法解决分布在答案许多部分的错误。