← 返回列表

一种神经网络模型训练、碱基识别方法及装置、电子设备

申请号: CN202410186555.3
申请人: 北京普译生物科技有限公司; 中国科学院生物物理研究所
申请日期: 2024/2/20

摘要文本

本公开涉及生物学基因测序领域,公开了一种神经网络模型训练、碱基识别方法及装置、电子设备,该方法包括:根据自监督预训练得到的基础模块和多个类型的微调模块,确定多个类型的碱基识别模型;针对任意一个类型的碱基识别模型,基于该碱基识别模型对样本碱基序列在预设测序场景下的样本电信号进行识别,确定该碱基识别模型对应的碱基识别结果;根据每个类型的碱基识别模型对应的碱基识别结果,对每个类型的碱基识别模型进行训练,得到训练后的多个类型的碱基识别模型;根据训练后的多个类型的碱基识别模型,确定在预设测序场景下的目标碱基识别模型。通过本公开实施例确定的碱基识别模型,能够提高碱基识别的精度和可靠性。

专利详细信息

项目 内容
专利名称 一种神经网络模型训练、碱基识别方法及装置、电子设备
专利类型 发明申请
申请号 CN202410186555.3
申请日 2024/2/20
公告号 CN117744748A
公开日 2024/3/22
IPC主分类号 G06N3/0895
权利人 北京普译生物科技有限公司; 中国科学院生物物理研究所
发明人 李清文; 孙琛; 娄继忠
地址 北京市大兴区北京经济技术开发区荣华中路10号1幢15层1501-3D; 北京市朝阳区大屯路15号中国科学院生物物理研究所

专利主权项内容

1.一种神经网络模型训练方法,其特征在于,包括:根据自监督预训练得到的基础模块和多个类型的微调模块,确定多个类型的碱基识别模型;针对任意一个类型的碱基识别模型,基于该碱基识别模型,对样本碱基序列在预设测序场景下对应的样本电信号进行识别,确定该碱基识别模型对应的碱基识别结果;根据每个类型的碱基识别模型对应的碱基识别结果,对每个类型的碱基识别模型进行训练,得到训练后的多个类型的碱基识别模型;根据训练后的多个类型的碱基识别模型,确定在所述预设测序场景下的目标碱基识别模型,其中,所述目标碱基识别模型用于对待识别碱基序列在所述预设测序场景下对应的测序电信号进行碱基识别。