← 返回列表
一种基于生物多组学数据的模型构建方法与系统
摘要文本
本发明涉及生物信息技术领域,尤其涉及一种基于生物多组学数据的模型构建方法与系统,包括:S1.样本数据获取与生物信息学分析;S2.输入嵌入:包括基因标记、表达值标记、知识标记、启动子标记、样本的组学类型标记、样本的批次数据标记和嵌入层;S3.模型的预训练:包括预训练框架和目标、注意力掩码;S4.模型的调整与应用。本发明引入了知识标记和启动子标记,使得模型能够理解生物学的专家知识;引入样本的组学类型标记和批次标记,原生支持多组学数据整合和批次效应去除,协助构建更合理的模型。
申请人信息
- 申请人:墨卓生物科技(浙江)有限公司
- 申请人地址:314504 浙江省嘉兴市桐乡市乌镇镇龙翔大道1888号2幢北侧3-7楼
- 发明人: 墨卓生物科技(浙江)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于生物多组学数据的模型构建方法与系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311796758.6 |
| 申请日 | 2023/12/25 |
| 公告号 | CN117476114A |
| 公开日 | 2024/1/30 |
| IPC主分类号 | G16B40/00 |
| 权利人 | 墨卓生物科技(浙江)有限公司 |
| 发明人 | 郑冠涛; 丛蓉 |
| 地址 | 浙江省嘉兴市桐乡市乌镇镇龙翔大道1888号2幢北侧3-7楼 |
专利主权项内容
1.一种基于生物多组学数据的模型构建方法,其特征在于,所述模型构建方法包括如下步骤:S1. 样本数据获取与生物信息学分析;S2. 输入嵌入:包括基因标记、表达值标记、知识标记、启动子标记、样本的组学类型标记、样本的批次数据标记和嵌入层;S3. 模型的预训练:包括预训练框架和目标、注意力掩码;S4. 模型的调整与应用。 来源:马 克 数 据 网