← 返回列表
一种基于大语言模型的转录因子结合位点预测方法及装置
摘要文本
本发明涉及一种基于大语言模型的转录因子结合位点预测方法及装置,属于生物信息技术领域。包括:获取待预测DNA序列,对待预测DNA序列进行预处理得到目标输入序列;将目标输入序列输入大语言模型中,输出全局特征矩阵;将全局特征矩阵输入卷积神经网络模块中,输出局部特征矩阵;将局部特征矩阵输入通道注意力模块中,输出通道强化特征矩阵;将通道强化特征矩阵输入空间注意力模块中,输出空间强化特征矩阵,将空间强化特征矩阵和局部特征矩阵进行残差连接得到强化局部特征矩阵;将强化局部特征矩阵输入全连接层,输出待预测DNA序列上存在转录因子结合位点的预测概率。本申请通过充分提取DNA序列的特征,提高了预测结果的准确性。
申请人信息
- 申请人:江南大学
- 申请人地址:214122 江苏省无锡市滨湖区蠡湖大道1800号
- 发明人: 江南大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于大语言模型的转录因子结合位点预测方法及装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311601226.2 |
| 申请日 | 2023/11/27 |
| 公告号 | CN117649877A |
| 公开日 | 2024/3/5 |
| IPC主分类号 | G16B20/30 |
| 权利人 | 江南大学 |
| 发明人 | 王锴; 曾炫; 周景文; 刘飞; 栾小丽; 王兴隆 |
| 地址 | 江苏省无锡市新吴区净慧东道66号(江南大学国家大学科技园) |
专利主权项内容
1.一种基于大语言模型的转录因子结合位点预测方法,其特征在于,包括:获取待预测DNA序列,对所述待预测DNA序列进行预处理得到目标输入序列;将所述目标输入序列输入至训练好的转录因子结合位点预测模型中的大语言模型中,输出全局特征矩阵;将所述全局特征矩阵输入至训练好的转录因子结合位点预测模型中的卷积神经网络模块中,输出局部特征矩阵;将所述局部特征矩阵输入至训练好的转录因子结合位点预测模型中的通道注意力模块中,输出通道强化特征矩阵;将所述通道强化特征矩阵输入至训练好的转录因子结合位点预测模型中的空间注意力模块中,输出空间强化特征矩阵,将所述空间强化特征矩阵和所述局部特征矩阵进行残差连接得到强化局部特征矩阵;将所述强化局部特征矩阵输入至训练好的转录因子结合位点预测模型中的全连接层,输出所述待预测DNA序列上存在转录因子结合位点的预测概率。。来源:马 克 数 据 网