← 返回列表
一种DNA序列增强子-启动子交互作用识别方法及装置
摘要文本
本发明公开了一种DNA序列增强子‑启动子交互作用识别方法及装置,属于医学工程技术领域。所述方法包括:获取细胞系对应的增强子‑启动子交互作用数据集;将数据集中的DNA序列对输入到预先训练好的自然语言模型中,获得每个DNA序列的词嵌入编码;利用获取的词嵌入编码构建图结构数据;利用图结构数据对图神经网络模型进行训练,获得训练好的图神经网络模型;获取待预测DNA序列对并输入到预先训练好的自然语言模型中,获得每个待预测DNA序列的词嵌入编码;根据预测的词嵌入编码构建图结构数据;将待预测图结构数据输入训练好的图神经网络模型中,获得DNA序列对中增强子‑启动子交互作用识别结果。采用本发明,可以提高增强子‑启动子交互作用识别准确率。
申请人信息
- 申请人:北京科技大学; 北京科技大学顺德创新学院
- 申请人地址:100083 北京市海淀区学院路30号
- 发明人: 北京科技大学; 北京科技大学顺德创新学院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种DNA序列增强子-启动子交互作用识别方法及装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311836407.3 |
| 申请日 | 2023/12/28 |
| 公告号 | CN117766027A |
| 公开日 | 2024/3/26 |
| IPC主分类号 | G16B30/00 |
| 权利人 | 北京科技大学; 北京科技大学顺德创新学院 |
| 发明人 | 龚海燕; 陈正元; 张晓彤 |
| 地址 | 北京市海淀区学院路30号北京科技大学; 广东省佛山市顺德区大良致慧路2号 |
专利主权项内容
1.一种DNA序列增强子-启动子交互作用识别方法,其特征在于,所述方法包括:S1、获取细胞系对应的增强子-启动子交互作用数据集;S2、将所述增强子-启动子交互作用数据集中的DNA序列-DNA序列对输入到预先训练好的自然语言模型中,获得每个DNA序列的词嵌入编码;S3、根据所述每个DNA序列的词嵌入编码对图数据进行构建,获得构建好的图结构数据;S4、利用所述构建好的图结构数据对图神经网络模型进行训练,获得训练好的图神经网络模型;S5、获取待预测DNA序列-DNA序列对;S6、将待预测DNA序列-DNA序列对输入到预先训练好的自然语言模型中,获得每个待预测DNA序列的词嵌入编码;根据每个待预测DNA序列的词嵌入编码对图结构数据进行构建,获得待预测图结构数据;S7、将所述待预测图结构数据输入所述训练好的图神经网络模型中,获得DNA序列-DNA序列中增强子-启动子交互作用识别结果。