← 返回列表

用于提取化合物专利文件中的主题药物的方法及装置

申请号: CN202311811193.4
申请人: 药渡经纬信息科技(北京)有限公司
申请日期: 2023/12/27

摘要文本

本公开的实施例提供一种用于提取化合物专利文件中的主题药物的方法及装置。该方法包括:获得化合物专利数据集,化合物专利数据集包括多个化合物专利文件;提取化合物专利数据集中的化合物的指定信息,化合物的指定信息包括:化合物在对应的化合物专利文件中出现的位置和频次以及在化合物专利数据集中出现的总频次;根据目标化合物专利文件中的多个目标化合物的指定信息来计算多个目标化合物的权重;根据多个目标化合物的权重来从多个目标化合物中确定候选化合物;计算候选化合物命中药物数据库中的药物的概率,其中,药物数据库包括不同研发阶段的药物结构信息;以及根据概率来确定目标化合物专利文件的主题药物。

专利详细信息

项目 内容
专利名称 用于提取化合物专利文件中的主题药物的方法及装置
专利类型 发明申请
申请号 CN202311811193.4
申请日 2023/12/27
公告号 CN117474000A
公开日 2024/1/30
IPC主分类号 G06F40/295
权利人 药渡经纬信息科技(北京)有限公司
发明人 伍星; 余志颖; 吴忠毅; 李靖; 丁红霞
地址 北京市海淀区上地五街7号1层105室

专利主权项内容

1.一种用于提取化合物专利文件中的主题药物的方法,其特征在于,所述方法包括:获得化合物专利数据集,所述化合物专利数据集包括多个化合物专利文件;提取所述化合物专利数据集中的化合物的指定信息,所述化合物的指定信息包括:所述化合物在对应的化合物专利文件中出现的位置和频次以及在所述化合物专利数据集中出现的总频次;根据目标化合物专利文件中的多个目标化合物的所述指定信息来计算所述多个目标化合物的权重;根据所述多个目标化合物的权重来从所述多个目标化合物中确定候选化合物;计算所述候选化合物命中药物数据库中的药物的概率,其中,所述药物数据库包括不同研发阶段的药物结构信息;以及根据所述概率来确定所述目标化合物专利文件的主题药物。