← 返回列表

对话式大语言模型监督训练评价系统

申请号: CN202410121885.4
申请人: 南京大经中医药信息技术有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 对话式大语言模型监督训练评价系统
专利类型 发明申请
申请号 CN202410121885.4
申请日 2024/1/30
公告号 CN117648430A
公开日 2024/3/5
IPC主分类号 G06F16/332
权利人 南京大经中医药信息技术有限公司
发明人 赵静; 董桂峰; 樊静; 李文友; 杨亮文
地址 江苏省南京市浦口区江淼路88号腾飞大厦B座15楼1501

摘要文本

本发明公开了对话式大语言模型监督训练评价系统,涉及人工智能领域,改善了现有对话模型由于训练不到位造成语言模型出现回复效率低下、输出结果精度不足等问题的问题,包括数据获取模块:获取模型训练数据,初次训练模块:对对话式大语言模型进行初次训练,并获取模型训练数据,模型评价模块:根据模型训练数据计算模型评价系数进行语言模型分类,二次训练模块:根据语言模型分类数据对对话式大语言模型进行二次训练,本发明通过采用两次监督训练的方式对对话式大语言模型进行训练,能够有效提高对话式大语言模型的对话准确性和一致性,更好地满足用户对对话式大语言模型的需求。

专利主权项内容

1.对话式大语言模型监督训练评价系统,其特征在于,包括:数据获取模块:通过爬虫技术利用互联网获取中医领域数据,通过基于人工智能的对话生成模型对中医领域数据进行处理,得到模型训练数据;初次训练模块:根据模型训练数据对对话式大语言模型进行初次训练,得到初次训练质量数据,针对初次训练质量数据通过混淆矩阵得到对话式大语言模型的对话准确率和对话召回率,利用对话式大语言模型的对话准确率和对话召回率计算得到对话式大语言模型的F1值;模型评价模块:分别根据对话式大语言模型的对话准确率、对话召回率以及F1值计算得到模型评价系数,并对模型评价系数进行阈值划分,得到语言模型分类数据;二次训练模块:根据语言模型分类数据对对话式大语言模型进行二次训练;还包括服务器,所述数据获取模块、初次训练模块、模型评价模块和二次训练模块分别与服务器相连。