← 返回列表

一种DNA序列增强子-启动子交互作用识别方法及装置

申请号: CN202311836407.3
申请人: 北京科技大学; 北京科技大学顺德创新学院
申请日期: 2023/12/28

摘要文本

本发明公开了一种DNA序列增强子‑启动子交互作用识别方法及装置,属于医学工程技术领域。所述方法包括:获取细胞系对应的增强子‑启动子交互作用数据集;将数据集中的DNA序列对输入到预先训练好的自然语言模型中,获得每个DNA序列的词嵌入编码;利用获取的词嵌入编码构建图结构数据;利用图结构数据对图神经网络模型进行训练,获得训练好的图神经网络模型;获取待预测DNA序列对并输入到预先训练好的自然语言模型中,获得每个待预测DNA序列的词嵌入编码;根据预测的词嵌入编码构建图结构数据;将待预测图结构数据输入训练好的图神经网络模型中,获得DNA序列对中增强子‑启动子交互作用识别结果。采用本发明,可以提高增强子‑启动子交互作用识别准确率。

专利详细信息

项目 内容
专利名称 一种DNA序列增强子-启动子交互作用识别方法及装置
专利类型 发明申请
申请号 CN202311836407.3
申请日 2023/12/28
公告号 CN117766027A
公开日 2024/3/26
IPC主分类号 G16B30/00
权利人 北京科技大学; 北京科技大学顺德创新学院
发明人 龚海燕; 陈正元; 张晓彤
地址 北京市海淀区学院路30号北京科技大学; 广东省佛山市顺德区大良致慧路2号

专利主权项内容

1.一种DNA序列增强子-启动子交互作用识别方法,其特征在于,所述方法包括:S1、获取细胞系对应的增强子-启动子交互作用数据集;S2、将所述增强子-启动子交互作用数据集中的DNA序列-DNA序列对输入到预先训练好的自然语言模型中,获得每个DNA序列的词嵌入编码;S3、根据所述每个DNA序列的词嵌入编码对图数据进行构建,获得构建好的图结构数据;S4、利用所述构建好的图结构数据对图神经网络模型进行训练,获得训练好的图神经网络模型;S5、获取待预测DNA序列-DNA序列对;S6、将待预测DNA序列-DNA序列对输入到预先训练好的自然语言模型中,获得每个待预测DNA序列的词嵌入编码;根据每个待预测DNA序列的词嵌入编码对图结构数据进行构建,获得待预测图结构数据;S7、将所述待预测图结构数据输入所述训练好的图神经网络模型中,获得DNA序列-DNA序列中增强子-启动子交互作用识别结果。