← 返回列表

一种解决大型语言模型幻觉问题的系统和方法

申请号: CN202410026756.7
申请人: 北京大学深圳研究生院
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种解决大型语言模型幻觉问题的系统和方法
专利类型 发明申请
申请号 CN202410026756.7
申请日 2024/1/9
公告号 CN117540811A
公开日 2024/2/9
IPC主分类号 G06N5/04
权利人 北京大学深圳研究生院
发明人 魏炜; 赖凯
地址 广东省深圳市南山区西丽镇丽水路深圳大学城北大校区北京大学深圳研究生院

摘要文本

本发明适用于大语言模型技术领域,提供了一种解决大型语言模型幻觉问题的系统和方法,所述系统包括:提问信息预处理大模型、信息搜索模块、微调后的溯源大语言模型以及校正模块。由于在进行第一次数据库搜索和可溯源的内容生成后,以提问信息、第一次检索项、第一次搜索结果以及生成的可溯源的内容作为预处理大模型的输入,生成更加精确的第二次检索项,在所述数据库中进行第二次搜索,并根据所述提问信息、第一次检索项、第一次搜索结果、可溯源的内容、第二次检索项以及第二次搜索结果,对所述可溯源的内容进行校正,返回校正后的可溯源的内容,提高了内容真实性和可信度,纠正可能存在的错误或误导性信息,解决了当前大语言模型的幻觉问题。

专利主权项内容

1.一种解决大型语言模型幻觉问题的系统,其特征在于,所述系统包括:提问信息预处理大模型,用于获取用户的提问信息,并根据所述提问信息生成用于数据库搜索的第一次检索项;信息搜索模块,用于根据所述第一次检索项在所述数据库中进行搜索,获得第一次搜索结果;微调后的溯源大语言模型,用于根据所述第一次搜索结果生成可溯源的内容,所述可溯源的内容包括内容的溯源信息;所述提问信息预处理大模型,还用于将所述提问信息、第一次检索项、第一次搜索结果以及可溯源的内容转换为用于所述数据库搜索的第二次检索项;所述信息搜索模块,还用于根据所述第二次检索项在所述数据库中进行第二次搜索,获得第二次增强搜索结果;以及校正模块,用于根据所述提问信息、第一次检索项、第一次搜索结果、可溯源的内容、第二次检索项以及第二次搜索结果,对所述可溯源的内容进行校正,返回校正后的可溯源的内容,所述校正后的可溯源的内容包括内容的溯源信息。 关注公众号马克数据网