作者:周晓雯 OpenAI似乎找到了解决生成式人工智能“一本正经胡说八道”的办法。 5月31日,OpenAI在其官网宣布,已经训练了一个模型,能够有助于消除生成式AI常见的“幻觉”和其他常见问题。 OpenAI表示,可以训练奖励模型来检测幻觉,奖励模型又分为结果监督(根据最终结果提供反馈)或过程监督(为思维链中的每个步骤提供反馈)模型。 也就是说,过程监督奖励推理的每个正确步骤,而结果监督只是简单地奖励正确的答案。 OpenAI表示,相比之下,过程监督有一个重要的优势——它直接训练模型以产生由人类认可的思维链: 过程监督与结果监督相比有几个一致性优势。它直接奖励遵循一致的思维链的模型,因为过程中的每一步都得到了精确的监督。过程监督也更有可能产生可解释的推理,因为它鼓励模型遵循人类批准的过程结果监督可能会奖励一个不一致的过程,而且通常更难审查。OpenAI在数学数据集上测试了这两种模型,发现过程监督方法导致了“显著更好的性能”。 但需要注意的是,到目前为止,过程监督方法仅在数学领域进行了测试,并且需要更多的工作来观察它如何更普遍地执行。 此外,OpenAI没有说明这一研究需要多长时间才能应用在ChatGPT,它仍然处于研究阶段。 虽然最初的结果是好的,但OpenAI确实提到,更安全的方法会产生降低的性能,称为对齐税(alignment tax)。 目前的结果显示,在处理数学问题时,过程监督不会产生对齐税,但在一般的信息上的情况尚不知晓。 生成式AI的“幻觉”生成式AI问世以来,围绕其编造虚假信息、“产生幻觉”的指控从未消失,这也是目前生成式AI模型最大的问题之一。 今年2月,谷歌为应对微软资助下ChatGPT,仓促推出了聊天机器人Bard,结果却被发现在演示中出现了常识性错误,导致谷歌股价大跌。 导致AI出现幻觉的原因有多种,输入数据欺骗AI程序进行错误分类是其中一种。 例如,开发人员使用数据(如图像、文本或其他类型)来训练人工智能系统,如果数据被改变或扭曲,应用程序将以不同的方式解释输入并产生不正确的结果。 幻觉可能会出现在像ChatGPT这样的基于语言的大型模型中,这是由于不正确的转换器解码,导致语言模型可能会产生一个没有不合逻辑或模糊的故事或叙述。 —- 编译者/作者:华尔街见闻 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
解决AI落地的最大障碍,OpenAI找到办法了?
2023-06-01 华尔街见闻 来源:区块链网络
LOADING...
相关阅读:
- AI狂热:新“脑谷”崛起,独角兽连夜诞生,投资人试图复刻下个OpenA2023-06-01
- Fantom基金会:Multichain与Fantom的桥接仍可正常运行,正研究发行原生Tok2023-06-01
- 欧盟委员会执行副主席:在接下来的几周内,将与美国推进关于人工智2023-05-31
- 万兴科技加速 AIGC 布局,旗下墨刀全球首发墨刀 AI2023-05-31
- 元宇宙晚报|新《终结者》剧本将由ChatGPT书写Meta发布AI模型2023-05-31