← 返回列表

数据标注方法、装置、计算机设备和存储介质

申请号: CN202410124620.X
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 数据标注方法、装置、计算机设备和存储介质
专利类型 发明申请
申请号 CN202410124620.X
申请日 2024/1/30
公告号 CN117649567A
公开日 2024/3/5
IPC主分类号 G06V10/764
权利人 腾讯科技(深圳)有限公司
发明人 王继天; 冯帅; 周梦
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

本申请涉及一种数据标注方法、装置、计算机设备、存储介质和计算机程序产品。所述方法涉及人工智能技术,包括:从待标注数据集中获取至少一个待标注数据,并确定至少两种候选类目;针对每个待标注数据,从至少两种候选类目中确定与所针对待标注数据相匹配的至少两种初步匹配类目;当初步匹配类目中包括参考类目,基于至少两种初步匹配类目对所针对待标注数据进行标注,得到所针对待标注数据的已标注数据;参考类目通过统计已标注数据集中的已标注数据确定;通过得到的各个已标注数据更新已标注数据集,并继续进行标注,直至针对待标注数据集中的待标注数据完成数据标注。采用本方法能够确保标注数据的类目分布均衡。。来源:马 克 团 队

专利主权项内容

1.一种数据标注方法,其特征在于,所述方法包括:从待标注数据集中获取至少一个待标注数据,并确定至少两种候选类目;针对所述至少一个待标注数据中的每个待标注数据,从所述至少两种候选类目中确定与所针对待标注数据相匹配的至少两种初步匹配类目;当所述至少两种初步匹配类目中包括参考类目,基于所述至少两种初步匹配类目对所述所针对待标注数据进行标注,得到所述所针对待标注数据的已标注数据;所述参考类目,是通过统计已标注数据集中的已标注数据确定的;通过所述至少一个待标注数据各自的已标注数据更新所述已标注数据集,并继续对所述待标注数据集中的待标注数据进行标注,直至针对所述待标注数据集中的待标注数据完成数据标注。。 (来源 马克数据网)