← 返回列表

蛋白质亚细胞迁移的时空蛋白质组学深度学习预测方法

申请号: CN202311738077.4
申请人: 南京医科大学
申请日期: 2023/12/18

摘要文本

本发明公开了一种蛋白质亚细胞迁移的时空蛋白质组学深度学习预测方法,其包括步骤:(1)构建大量已知蛋白质定位和迁移标签的合成数据集;(2)通过分别计算蛋白质在对照组和实验组中组分表达的距离特征,合成数据集和真实数据集中蛋白质的关系混合图,以及真实数据集中蛋白质的PSL标签和迁移标签的期望概率进行数据挖掘;(3)将合成数据集和真实数据中蛋白质的组分表达特征和距离特征合并后标准化作为特征输入,以及标准化后的关系混合图作为邻接矩阵输入,使用半监督图卷积神经网络模型分别预测蛋白质的PSL标签和迁移标签。本发明可实现对基于质谱仪的时空蛋白质组学蛋白质亚细胞迁移的高效、准确预测。

专利详细信息

项目 内容
专利名称 蛋白质亚细胞迁移的时空蛋白质组学深度学习预测方法
专利类型 发明申请
申请号 CN202311738077.4
申请日 2023/12/18
公告号 CN117672353A
公开日 2024/3/8
IPC主分类号 G16B20/00
权利人 南京医科大学
发明人 郭雪江; 李妍; 司徒成昊; 王兵
地址 江苏省南京市江宁区龙眠大道101号

专利主权项内容

1.一种蛋白质亚细胞迁移的时空蛋白质组学深度学习预测方法,其特征在于,包括以下步骤:(1)基于蛋白质亚细胞分离组分定量的时空蛋白质组质谱数据,选取有高质量已知蛋白质亚细胞定位的蛋白质,将对照组中任意一个高质量已知亚细胞定位的蛋白质和实验组中另一个高质量已知亚细胞定位的蛋白质进行拼接得到新的合成蛋白质,从而构建大量已知蛋白质定位和迁移标签的合成数据集;(2)通过分别计算蛋白质在对照组和实验组中组分表达的距离特征,合成数据集和真实数据集中蛋白质的关系混合图,以及真实数据集中蛋白质的PSL标签和迁移标签的期望概率进行数据挖掘;(3)将合成数据集和真实数据中蛋白质的组分表达特征和距离特征合并后标准化作为特征输入,以及标准化后的关系混合图作为邻接矩阵输入,使用半监督图卷积神经网络模型分别预测蛋白质的PSL标签和迁移标签。