基于大模型的知识加工、知识问答方法、装置及介质
申请人信息
- 申请人:青岛海尔科技有限公司; 青岛海尔智能家电科技有限公司; 海尔优家智能科技(北京)有限公司
- 申请人地址:266101 山东省青岛市崂山区海尔工业园内
- 发明人: 青岛海尔科技有限公司; 青岛海尔智能家电科技有限公司; 海尔优家智能科技(北京)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于大模型的知识加工、知识问答方法、装置及介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410185839.0 |
| 申请日 | 2024/2/20 |
| 公告号 | CN117743558A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F16/332 |
| 权利人 | 青岛海尔科技有限公司; 青岛海尔智能家电科技有限公司; 海尔优家智能科技(北京)有限公司 |
| 发明人 | 邓邱伟; 张旭; 付振宇; 刘朝振; 王淼 |
| 地址 | 山东省青岛市崂山区海尔路1号海尔工业园; 山东省青岛市崂山区海尔工业园内; 北京市海淀区知春路106号太平洋国际大厦6层601-606室 |
摘要文本
本申请公开了一种基于大模型的知识加工、知识问答方法、装置及介质,涉及人工智能领域,该方法包括:获取目标文档对应的目标图片文件;对所述目标图片文件进行解析,获取解析结果,所述解析用于指示对所述目标图片文件中的每一张图片的元素进行提取;根据所述解析结果中标题对应的级别和所述正文内容,获取层级嵌套的知识片段,其中,每个标题对应一个级别,下一级标题为上一级标题的子标题,每个标题对应的知识片段包括本标题对应的正文内容和下一级标题的知识片段;根据层级嵌套的知识片段,生成问答数据库,以使在知识问答时根据问答数据库获取答案。该方法实现了知识加工的高可靠性和拓展性,从而达到提升回答内容的质量,增强了用户体验。
专利主权项内容
1.一种基于大模型的知识加工方法,其特征在于,包括:获取目标文档对应的目标图片文件,其中,所述目标文档表示待解析的不可编辑格式的文档,所述目标图片文件表示所述目标文档转化为图片格式后形成的文件;对所述目标图片文件进行解析,获取解析结果,所述解析用于指示对所述目标图片文件中的每一张图片的元素进行提取,所述元素包括标题和正文内容;根据所述解析结果中标题对应的级别和所述正文内容,获取层级嵌套的知识片段,其中,每个所述标题对应一个级别,下一级标题为上一级标题的子标题,每个标题对应的知识片段包括本标题对应的正文内容和下一级标题的知识片段;根据所述层级嵌套的知识片段,生成问答数据库,以使在知识问答时根据所述问答数据库获取答案;其中,所述问答数据库包括问答知识库、文本数据库以及向量数据库,所述问答知识库包括通过大模型获取的每个知识片段对应的问答内容和问答内容对应的目标层级,所述文本数据库用于存储多个子文本数据库,不同子文本数据库存储有不同嵌套层级的知识片段,所述向量数据库用于存储多个子向量数据库,不同子向量数据库用于存储不同嵌套层级的知识片段的向量数据。。微信公众号马克 数据网