← 返回列表

一种语料自动标注的方法、装置、存储介质及电子设备

申请号: CN202311695823.6
申请人: 中国科学院文献情报中心
申请日期: 2023/12/11

摘要文本

本申请提供了一种语料自动标注的方法、装置、存储介质及电子设备,该方法包括:获取语料标注需求,其中,所述语料标注需求包括:语料类型、语料训练分类数量、语料标签、语料标注范围以及语料正负样本比例中的至少一种;对待标注文献进行标题识别,并对所述标题对应的内容进行处理,获取待分类文件;根据所述待分类文件和预训练分类模型,获取与所述语料标注需求对应的语料标注数据。本申请的实施例可以实现语料的自动标注,效率较高。。搜索专利查询网

专利详细信息

项目 内容
专利名称 一种语料自动标注的方法、装置、存储介质及电子设备
专利类型 发明申请
申请号 CN202311695823.6
申请日 2023/12/11
公告号 CN117743573A
公开日 2024/3/22
IPC主分类号 G06F16/35
权利人 中国科学院文献情报中心
发明人 王猛; 张智雄; 李涵昱; 刘熠; 邵田; 张广寅
地址 北京市海淀区中关村北四环西路33号

专利主权项内容

1.一种语料自动标注的方法,其特征在于,包括:获取语料标注需求,其中,所述语料标注需求包括:语料类型、语料训练分类数量、语料标签、语料标注范围以及语料正负样本比例中的至少一种;对待标注文献进行标题识别,并对所述标题对应的内容进行处理,获取待分类文件;根据所述待分类文件和预训练分类模型,获取与所述语料标注需求对应的语料标注数据。