—— 汽车产业链供需平台 ——
下载盖世APP

首页 > 资讯 > 新技术 > 研究人员推出框架KnowHalu 检测大语言模型

研究人员推出框架KnowHalu 检测大语言模型生成文本中的“幻觉”

盖世汽车 刘丽婷 2024-05-11 11:22:24
分享

盖世汽车讯 大型语言模型(LLM)是基于人工智能的先进对话系统,可以回答用户查询并按照人类指令生成文本。OpenAI开发的高性能模型ChatGPT出现后,这些模型变得越来越受欢迎,并且越来越多的公司开始投资并开发。

尽管承诺实时回答人类问题并为特定目的创建文本,但LLM有时会生成无意义、不准确或不相关的文本,这些文本与人类用户提供给他们的提示不同。这种现象通常与用于训练模型的数据的局限性或其潜在推理中的错误有关,被称为LLM“幻觉”。

据外媒报道,伊利诺伊大学厄巴纳-香槟分校(University of Illinois Urbana-Champaign)研究人员最近推出一个用于检测LLM生成文本中的幻觉的框架KnowHalu。据悉,相关论文已上传在arXiv网站,介绍称可以帮助提高这些模型的可靠性,并简化完成各种文本生成任务的使用。

检测 arxiv.jpg

图片来源:arXiv网站

“随着LLM的不断进步,幻觉成为阻碍其在现实世界更广泛应用的一个关键障碍,”该项目顾问Bo Li表示。“尽管大量研究已经解决了LLM的幻觉,但现有的方法往往无法有效利用现实世界的知识或利用效率低下。受这一差距的启发,我们为LLM开发了一种新颖的多形式基于知识的幻觉检测框架。此外,我们还发现,当前有关非制造幻觉的研究存在差距:事实正确但与查询无关或不特定的响应。”

当Li及其合作者回顾过去的文献时,他们发现过去许多旨在检测LLM幻觉的方法都集中在生成无意义的文本,而不是与用户提示不符的事实准确的文本。因此,此次开发的新框架还具有一个专用组件,旨在检测这些类型的准确但不相关的幻觉。

“KnowHalu是一个新颖的框架,旨在检测LLM生成的反应中的幻觉,”Li解释道。“通过使用涉及多个组件的两阶段过程来运行,该框架可以确保LLM输出的准确性和相关性。第一阶段的重点是检测非虚构幻觉,这些幻觉可能实际上是正确的,但与当前的查询无关或不特定,而当前的文献中很大程度上缺少这种检测。”

在运营的第二阶段,KnowHalu采用了跨五个步骤的多形式基于知识的事实检查流程。这些步骤是:逐步推理和查询、知识检索、知识优化、基于多形式知识的判断和判断聚合。

“这个全面的流程有助于识别LLM提供的无根据或不相关的信息,使KnowHalu在不同的应用程序中特别有效,例如质量保证和总结任务,”Li解释说。

与其他LLM幻觉检测方法相比,KnowHalu具有多个独特的特征和优势。最值得注意的是,它还可以检测非捏造的幻觉,可以评估不同类型的查询,并利用新开发的多形式知识支持的事实检查流程。

Li及其学生对该框架进行了一系列测试,发现其性能优于其他各种基线方法和LLM幻觉检测工具。研究人员还利用KnowHalu收集了LLM模型中关于幻觉的有趣见解。

首先,研究人员发现不同的提示和不同的模型在某些类型的知识上可以获得更好的结果。例如,Starling-7B模型在给出非结构化知识时表现出色,而GPT-3.5在给出结构化知识时效率更高。

“我们的多形式基于知识的RAG显著优于首次提出的标准RAG,”Li表示。 “此外,我们发现后来发布的模型具有更高的利用结构化数据的能力,凸显了我们多形式知识算法的重要性。KnowHalu显著优于不同的SOTA基线,甚至比直接提示GPT-4执行幻觉检测要好得多,这证明了其有效性以及幻觉检测和缓解的可能性。”

Li及其合作者收集的研究结果还表明,旨在信息检索的用户查询的制定会显著影响LLM生成的答复的质量。

具体来说,如果用户寻求推测性或模糊的答案,建议提出一般性问题,但如果寻求更具体的答案,用户应该提供更详细的提示,突出显示使用所谓的“标识符”寻求的信息类型”。这些标识符通常也存在于模型所依赖的数据库中,因此模型更容易检索准确的信息。

未来,KnowHalu可以为开发表现更好的LLM提供信息,这些LLM不会经常产生幻觉并产生更可靠的反应。此外,新框架可以激励其他研究团队设计出解决更广泛的LLM幻觉的方法。

Li表示:“此外,我们将尝试基于给定的知识库为LLM幻觉提供理论保证,并使我们的框架适应自动驾驶代理和医疗保健代理等不同的应用领域。”

关注我们更多服务平台

添加社区公众号、小程序, APP, 随时随地云办公尽在掌握

联系我们
盖世汽车社区 盖世汽车中文资讯 盖世汽车会议 盖世汽车研究院 盖世大学堂 Automotive News Global Auto Sources 友情链接 Copyright@2007-2022 All Right Reserved.盖世汽车版权所有
增值电信业务经营许可证 沪B2-2007118 沪ICP备07023350号 沪公网安备 31011402009699号 未经授权禁止复制或建立影像,否则将追究法律责任。