← 返回列表

基于LLM的数据资产指标问答方法及系统

申请号: CN202410022765.9
申请人: 北京三维天地科技股份有限公司
申请日期: 2024/1/8

摘要文本

本发明提供了基于LLM的数据资产指标问答方法及系统,通过并基于业务类型,对指标数据和元数据进行匹配处理,得到每个业务类型对应的训练数据,实现对指标数据和元数据的处理,为模型的训练和评估提供高质量数据基础,通过获取每个业务类型的对应的初始语言模型,基于训练数据对初始语言模型进行训练,保证得到的第二语言模型针对业务类型的精确性,实现对业务类型的高精度解析,为指标数据的匹配提供模型基础,通过基于问答数据对第二语言模型进行评估,保证构建得到的LLM模型对全部业务类型解析的全面性和准确性,保证数据资产指标的问答的准确性和全面性,实现数据资产的有效利用。

专利详细信息

项目 内容
专利名称 基于LLM的数据资产指标问答方法及系统
专利类型 发明申请
申请号 CN202410022765.9
申请日 2024/1/8
公告号 CN117829161A
公开日 2024/4/5
IPC主分类号 G06F40/30
权利人 北京三维天地科技股份有限公司
发明人 金震; 张京日; 万俊
地址 北京市海淀区西四环北路119号A座3层309室

专利主权项内容

1.一种基于LLM的数据资产指标问答方法,其特征在于,包括:S1:采集用于业务分析的指标数据和元数据,并基于业务类型,对指标数据和元数据进行匹配处理,得到每个业务类型对应的训练数据;S2:获取每个业务类型的对应的初始语言模型,基于训练数据对初始语言模型进行训练,得到第二语言模型;S3:基于问答数据对第二语言模型进行评估,基于评估通过的第二语言模型构建得到LLM模型;S4:获取当前任务,基于LLM模型对当前任务进行自然语言解析,得到目标数据资产指标;S5:基于目标数据资产指标的指标属性,生成指标结果,并以图表形式展现。