← 返回列表

一种基于生物多组学数据的模型构建方法与系统

申请号: CN202311796758.6
申请人: 墨卓生物科技(浙江)有限公司
申请日期: 2023/12/25

摘要文本

本发明涉及生物信息技术领域,尤其涉及一种基于生物多组学数据的模型构建方法与系统,包括:S1.样本数据获取与生物信息学分析;S2.输入嵌入:包括基因标记、表达值标记、知识标记、启动子标记、样本的组学类型标记、样本的批次数据标记和嵌入层;S3.模型的预训练:包括预训练框架和目标、注意力掩码;S4.模型的调整与应用。本发明引入了知识标记和启动子标记,使得模型能够理解生物学的专家知识;引入样本的组学类型标记和批次标记,原生支持多组学数据整合和批次效应去除,协助构建更合理的模型。

专利详细信息

项目 内容
专利名称 一种基于生物多组学数据的模型构建方法与系统
专利类型 发明申请
申请号 CN202311796758.6
申请日 2023/12/25
公告号 CN117476114A
公开日 2024/1/30
IPC主分类号 G16B40/00
权利人 墨卓生物科技(浙江)有限公司
发明人 郑冠涛; 丛蓉
地址 浙江省嘉兴市桐乡市乌镇镇龙翔大道1888号2幢北侧3-7楼

专利主权项内容

1.一种基于生物多组学数据的模型构建方法,其特征在于,所述模型构建方法包括如下步骤:S1. 样本数据获取与生物信息学分析;S2. 输入嵌入:包括基因标记、表达值标记、知识标记、启动子标记、样本的组学类型标记、样本的批次数据标记和嵌入层;S3. 模型的预训练:包括预训练框架和目标、注意力掩码;S4. 模型的调整与应用。 来源:马 克 数 据 网