← 返回列表

活性预测模型训练及活性预测相关产品

申请号: CN202410161541.6
申请人: 北京悦康科创医药科技股份有限公司
申请日期: 2024/2/5

摘要文本

本发明提供一种多肽与受体结合活性预测模型训练及活性预测相关产品。该模型训练方法的一具体实施方式包括:首先确定训练样本特征集,其中,训练样本特征对应有样本多肽氨基酸序列、样本受体氨基酸序列以及用于表征样本多肽和样本受体之间结合活性程度的标注活性值,训练样本特征包括多肽序列和受体序列对特征、多肽分子指纹特征和多肽描述符特征。然后,基于训练样本特征集中的训练样本特征以及相应标注活性值,对初始多肽与受体结合活性预测模型进行训练,得到训练后的多肽与受体结合活性预测模型。即,通过多肽和受体结合活性预测的多模态预测模型,进行全方面的信息融合,可提高多肽与受体活性预测的准确性。

专利详细信息

项目 内容
专利名称 活性预测模型训练及活性预测相关产品
专利类型 发明申请
申请号 CN202410161541.6
申请日 2024/2/5
公告号 CN117711525A
公开日 2024/3/15
IPC主分类号 G16C20/30
权利人 北京悦康科创医药科技股份有限公司
发明人 赵化建; 宋更申; 蔡利锋
地址 北京市大兴区北京经济技术开发区科创七街11号院3号楼1层101室

专利主权项内容

1.一种多肽与受体结合活性预测模型训练方法,包括:确定训练样本特征集,其中,训练样本特征对应有样本多肽氨基酸序列、样本受体氨基酸序列以及用于表征样本多肽和样本受体之间结合活性程度的标注活性值,训练样本特征包括多肽序列和受体序列对特征、多肽分子指纹特征和多肽描述符特征,其中,多肽序列和受体序列对特征为基于样本多肽氨基酸序列和样本受体氨基酸序列进行特征表示得到的特征,多肽分子指纹特征为基于样本多肽氨基酸序列对应的摩根分子指纹信息得到的特征,多肽描述符特征为基于样本多肽氨基酸序列对应的至少一个多肽描述符得到的特征;基于所述训练样本特征集中的训练样本特征以及相应标注活性值,对初始多肽与受体结合活性预测模型进行训练,得到训练后的多肽与受体结合活性预测模型。