← 返回列表
一种语料自动标注的方法、装置、存储介质及电子设备
摘要文本
本申请提供了一种语料自动标注的方法、装置、存储介质及电子设备,该方法包括:获取语料标注需求,其中,所述语料标注需求包括:语料类型、语料训练分类数量、语料标签、语料标注范围以及语料正负样本比例中的至少一种;对待标注文献进行标题识别,并对所述标题对应的内容进行处理,获取待分类文件;根据所述待分类文件和预训练分类模型,获取与所述语料标注需求对应的语料标注数据。本申请的实施例可以实现语料的自动标注,效率较高。。搜索专利查询网
申请人信息
- 申请人:中国科学院文献情报中心
- 申请人地址:100089 北京市海淀区中关村北四环西路33号
- 发明人: 中国科学院文献情报中心
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种语料自动标注的方法、装置、存储介质及电子设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311695823.6 |
| 申请日 | 2023/12/11 |
| 公告号 | CN117743573A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F16/35 |
| 权利人 | 中国科学院文献情报中心 |
| 发明人 | 王猛; 张智雄; 李涵昱; 刘熠; 邵田; 张广寅 |
| 地址 | 北京市海淀区中关村北四环西路33号 |
专利主权项内容
1.一种语料自动标注的方法,其特征在于,包括:获取语料标注需求,其中,所述语料标注需求包括:语料类型、语料训练分类数量、语料标签、语料标注范围以及语料正负样本比例中的至少一种;对待标注文献进行标题识别,并对所述标题对应的内容进行处理,获取待分类文件;根据所述待分类文件和预训练分类模型,获取与所述语料标注需求对应的语料标注数据。