一种基于知识增强的知识图谱问答方法

申请号: CN202311724158.9

申请人: 中国科学技术大学

更新日期: 2026-03-09

摘要文本

中国科学技术大学取得“一种透气窗帘布”专利技术，本发明公开了一种基于知识增强的知识图谱问答方法，包括：将目标图像、目标问题输入到已训练完成的医学视觉语言模型中；将目标图像通过图像编码器编码得到目标图像特征，将目标问题通过文本编码器编码得到目标语言特征；基于目标图像特征与预训练后医学视觉语言模型的知识表示池中图像特征表示之间的相似度得分，结合知识表示池中的知识特征表示得到目标图像知识表示；基于跨模态注意力融合机制融合目标图像知识表示、目标图像特征和目标语言特征，以输出知识增强的多模态表示特征；将多模态表示特征输入到答案分类器中以输出与目标问题对应的医学回答；该知识图谱问答方法提高了医学视觉语言模型对输入问题的输出准确度。

专利主权项内容

1.一种基于知识增强的知识图谱问答方法，其特征在于，包括如下步骤：S100：将目标图像、目标问题输入到已训练完成的医学视觉语言模型中，所述医学视觉语言模型包括视觉编码器、文本编码器、跨模态注意力融合机制和答案分类器；S200：将目标图像通过图像编码器编码得到目标图像特征，将目标问题通过文本编码器编码得到目标语言特征；S300：计算目标图像特征与预训练后医学视觉语言模型的知识表示池中图像特征表示之间的相似度得分，将按降序排列的前个相似度得分的加权相加并结合知识表示池中知识特征表示得到目标图像知识表示；S400：基于跨模态注意力融合机制融合目标图像知识表示、目标图像特征和目标语言特征，以输出知识增强的多模态表示特征；S500：将多模态表示特征输入到答案分类器中以输出与目标问题对应的医学回答；所述医学视觉语言模型的预训练过程如下：S1：构建预训练数据集，提取训练数据集中所有医学文本中的医学实体，将医学实体链接到知识库中得到知识图谱子图，对知识图谱子图使用图表示学习的方法得到所有医学实体的嵌入表示，基于所有医学实体的嵌入表示构建知识实体集，所述预训练数据集包括医学图像、知识实体集和医学文本；S2：使用视觉编码器、文本编码器、知识编码器分别对医学图像、医学文本、知识实体集进行编码得到视觉表示、语言表示/>和知识表示/>；S3：使用基于跨模态注意力融合机制融合视觉表示、语言表示/>和知识表示/>，得到基于知识增强的视觉多模态表示特征/>和语言多模态表示特征/>，医学视觉语言模型预训练结束后，基于视觉表示/>和知识表示/>构建知识表示池P，P的组织形式为(/>，其中为图像特征表示，/>为知识特征表示，/>表示序号，/>，/>为知识表示池P的大小。

专利申请信息

项目	内容
专利名称	一种基于知识增强的知识图谱问答方法
专利类型	发明申请
申请号	CN202311724158.9
申请日	2023/12/15
公告号	CN117407541A
公开日	2024/1/16
IPC主分类号	G06F16/36
权利人	中国科学技术大学
发明人	张信明; 凌海锋
地址	安徽省合肥市包河区金寨路96号

一种基于知识增强的知识图谱问答方法

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

一种基于知识增强的知识图谱问答方法

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

一种基于大数据的区域安全态势分析预警方法

一种一二次分离长时限一体式限流装置

一种用于制备自支撑薄膜的高性能水溶性牺牲材料及其制备方法与应用

全时段天空地一体化超光谱温室/污染气体立体遥测和溯源以及预测方法

一种温室气体观测设备运行状态监测预警方法及系统

一种快捷封堵拱顶浇筑口的装置及其工作方法

热门技术领域

快速入口

专利技术资料