基于中国药典的中药饮片知识图谱的构建方法和系统
摘要文本
本发明涉及基于中国药典的中药饮片知识图谱的构建方法和系统;该构建方法包括:从中国药典文献中获取中药饮片信息;获取中药饮片的属性信息和实例信息;构建实例节点集;构建中药饮片本体‑实例分类概念结构层次;构建属性关系;采用可视化的形式输出中药饮片知识图谱模型。本发明提供的图谱能够简洁地反映中药饮片的相关信息以及不同种类中药饮片之间的关联信息,便于深层次地了解中药中隐藏的知识,同时,将计算机领域先进的本体理念引入到中药知识研究中,构建中药饮片本体,能够实现中药饮片信息的知识化重组,进而为中药领域的数据挖掘和知识发现提供数据基础。
申请人信息
- 申请人:神州医疗科技股份有限公司
- 申请人地址:100080 北京市海淀区颐和园路2号未来科技大厦主楼12层1201室
- 发明人: 神州医疗科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于中国药典的中药饮片知识图谱的构建方法和系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311719985.9 |
| 申请日 | 2023/12/14 |
| 公告号 | CN117408338B |
| 公开日 | 2024/3/12 |
| IPC主分类号 | G06N5/022 |
| 权利人 | 神州医疗科技股份有限公司 |
| 发明人 | 付涛涛; 陈艳梅; 陈敏; 弓孟春 |
| 地址 | 北京市海淀区颐和园路2号未来科技大厦主楼12层1201室 |
专利主权项内容
来源:马 克 数 据 网 。1.基于中国药典的中药饮片知识图谱的构建方法,其特征在于,包括以下步骤:从中国药典文献中获取中药饮片信息;所述中国药典文献为2020年版《中国药典》(一部);采用手工录入的方式获取2020年版《中国药典》(一部)的中药饮片信息;所述中药饮片信息包括中药饮片名称、适应症、证候、治疗作用、炮制品、禁忌、归经、毒性、五味、四气、类别、科属、药用部位、采收时间、用药剂量、贮藏方式和活性成分;基于文本信息分布特性,通过Excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息;所述基于文本信息分布特性,通过Excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息,包括:基于文本信息分布特性,根据符号特征和/或换行符分界线特征和/或关键词形式特征,采用Excel文本分列技术对中药饮片信息中所包含的文本信息进行文本属性拆分,获取中药饮片的属性信息和实例信息;其中,文本信息分布特性由2020年版《中国药典》(一部)中涉及的中药饮片的正文内容决定,在2020年版《中国药典》(一部)中涉及的中药饮片的正文内容是按照药物自身的理化与生物学特性、来源以及贮藏顺序进行设定的,属性信息之间具有符号特征和/或换行符分界线特征;通过Protégé工具加载中药饮片的实例信息,参考SNOMED CT概念模型构建实例节点集;所述通过Protégé工具加载中药饮片的实例信息,参考SNOMED CT概念模型构建实例节点集,包括:基于NLP技术,对中药饮片的实例信息进行语义分析,通过Protégé工具加载中药饮片的实例信息,参考SNOMED CT概念模型构建实例节点集,其中,实例节点集包括中药性能类实例节点集、临床发现类实例节点集和限定值类实例节点集;中药性能类实例节点集包括四气的实例信息和五味的实例信息,其中,四气的实例信息包括热、寒和温,五味的实例信息包括甘、苦和咸;临床发现类实例节点集包括中医证候的实例信息和中医疾病的实例信息,其中,中医证候的实例信息包括肺热证和脾虚证;中医疾病的实例信息包括感冒和高血压;限定值类实例节点集包括采收时间的实例信息,其中,采收时间的实例信息包括春、夏和冬;通过Protégé工具参考SNOMED CT概念模型构建中药饮片本体-实例分类概念结构层次;基于文本信息分布特性,加载中药饮片的实例信息中所包含的数据属性和对象属性,构建属性关系;将Protégé工具中的实例信息和属性关系存储到Neo4j图数据库中,通过在Neo4j图数据库中输入查询条件进行查询,得到符合条件的中药饮片知识图谱模型,并采用可视化的形式输出中药饮片知识图谱模型。