基于卷积稀疏编码和最优传输的多模态数据整合方法
摘要文本
本发明公开了一种基于卷积稀疏编码和最优传输的多模态数据整合方法,该方法利用卷积稀疏编码协同地学习两个多模态输入特征的潜在表示,从方法论的角度缓解了神经网络的可解释性问题。在生成潜在空间时,为了更好地学习数据的分布情况,采用了最优传输理论,以解决真实分布和生成分布可能没有重叠的问题。进而基于多模态数据之间的相关矩阵进行对齐,在对齐点对两个模态的潜在空间组合,引导相似样本在不同模态之间有相似表达,最终实现多模态数据的整合。本发明使得整合后的潜在空间分类精度显著提升,适用于生物医学领域单细胞测序数据和影像数据等多组学数据整合分析。
申请人信息
- 申请人:河南大学; 黄河水利职业技术学院
- 申请人地址:450000 河南省郑州市郑东新区明理路北段379号
- 发明人: 河南大学; 黄河水利职业技术学院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于卷积稀疏编码和最优传输的多模态数据整合方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311838303.6 |
| 申请日 | 2023/12/28 |
| 公告号 | CN117763499A |
| 公开日 | 2024/3/26 |
| IPC主分类号 | G06F18/25 |
| 权利人 | 河南大学; 黄河水利职业技术学院 |
| 发明人 | 杨晓慧; 李静静; 冯元; 彭李超; 宋宇; 秦蒙恩 |
| 地址 | 河南省郑州市郑东新区明理路北段379号; 河南省开封市东京大道1号 |
专利主权项内容
1.基于卷积稀疏编码和最优传输的多模态数据整合方法,其特征在于:包括以下步骤:1)获取多模态训练数据:用户从本地选择训练所用的多模态数据集,读取两个数据集Data X和Data Y以及相关的元数据信息;并且随机采样数据,包括样本的随机采样、使用主成分分析特征降维以及对标签进行处理;然后数据预处理,包括对数据的标准化和缺失值处理,得到两个模态的输入特征Modality X和Modality Y;2)构建模型:使用CSC层分别学习两个模态的潜在表示,捕捉多模态数据内部关键结构和特征,经过CSC的内部迭代更新,将输出结果传入前馈神经网络后,再输入到全连接层以得到均值和方差;基于此进行分布采样,并利用高斯噪声模拟采样效果,得到两个相似的潜在空间,通过相关矩阵对齐两个多模态潜在空间;在对齐点处对两个潜在空间线性组合,得到聚合的潜在空间;在学习潜在空间时,使用最优传输使得生成潜在空间分布逼近标准正态分布,以此构建出基于CSC和最优传输理论的聚合方法;通过不断迭代学习,当损失函数的值收敛到最小时,保存该模型;3)根据聚合的信息进行分类:载入已经训练好的模型,并训练K最近邻分类器,用于对测试数据分类,检测模型效果,用户根据自己的数据特性,调节网络参数,以达到最佳检测效果。