一种基于多模态先验信息的顺式调控模体识别方法
摘要文本
本发明涉及一种基于多模态先验信息的顺式调控模体识别方法,该方法包括如下步骤:首先,构建直系同源保守性、核小体定位、DNA双链体稳定性和转录因子结构类别先验信息子库,并转化为对应的知识图谱;接着,基于多种知识图谱生成模体识别的最优路径;最后,对得到的路径对应的特征采用模型融合的方法进行挖掘,得到最终的顺式调控模块;本发明通过从不同维度进行精准定位和识别,解决了现有技术方案顺式调控模体识别中存在的距离未知、顺序未知以及个数未知的问题。
申请人信息
- 申请人:徐州医科大学
- 申请人地址:221100 江苏省徐州市铜山路209号
- 发明人: 徐州医科大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于多模态先验信息的顺式调控模体识别方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311829307.8 |
| 申请日 | 2023/12/28 |
| 公告号 | CN117746997A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G16B40/20 |
| 权利人 | 徐州医科大学 |
| 发明人 | 吴响; 王换换; 王丽丽; 鹿川川 |
| 地址 | 江苏省徐州市云龙区铜山路209号 |
专利主权项内容
1.一种基于多模态先验信息的顺式调控模体识别方法,其特征在于,该方法包括以下步骤:S1、采集跨源数据,并对跨源数据进行比对分析、整理得到包括直系同源保守性模态、核小体定位模态、DNA双链体稳定性能量模态以及转录因子结构类别模态的先验信息表,并集中保存在多模态先验信息库中,以形成直系同源保守性先验信息子库、核小体定位先验信息子库、DNA双链体稳定性能量先验信息子库以及转录因子结构类别先验信息子库;S2、对多模态先验信息库的实体及实体关系进行抽取,获取直系同源保守性模态、核小体定位模态、DNA双链体稳定性能量模态以及转录因子结构类别模态的结构化先验信息表,生成直系同源保守性模态、核小体定位模态、DNA双链体稳定性能量模态以及转录因子结构类别模态的知识图谱;S3、对直系同源保守性模态、核小体定位模态、DNA双链体稳定性能量模态以及转录因子结构类别模态的知识图谱进行知识图谱对齐操作,得到多模态知识图谱;S4、确定待识别序列的特征,根据多模态知识图谱对所述的特征进行判断:条件1:是否是已知直系同源的分类;条件2:是否是已知核小体定位信息;条件3:是否是已知DNA双链体自由能;条件4:是否是已知转录因子结构类别;若满足条件数=4,则直接将所述的特征输入CNN分类器中实现模体序列的识别;若满足条件数<4,则采用并行模型融合方法对顺式调控模体数据进行识别。