← 返回列表

文本数据的处理方法和装置、以及存储介质和电子装置

申请号: CN201810444924.9
申请人: 腾讯科技(北京)有限公司
申请日期: 2018年5月10日

摘要文本

本发明公开了一种文本数据的处理方法和装置、以及存储介质和电子装置。其中,该方法包括:抓取多个媒体资源集的每个媒体资源集中目标媒体资源的文本数据,得到多个文本,其中,多个文本与多个媒体资源集一一对应;确定多个文本中任意两个文本之间的文本相似度值;根据每个文本相对于多个文本中其它文本的文本相似度值,确定对应文本的文本准确度值;根据多个文本中文本准确度值符合目标条件的文本,对目标媒体资源集中的目标媒体资源的文本数据进行处理。本发明解决了相关技术中对文本数据进行处理的方法效率较低的技术问题。

专利详细信息

项目 内容
专利名称 文本数据的处理方法和装置、以及存储介质和电子装置
专利类型 发明授权
申请号 CN201810444924.9
申请日 2018年5月10日
公告号 CN110196920B
公开日 2024年2月9日
IPC主分类号 G06F16/78
权利人 腾讯科技(北京)有限公司
发明人 汤见乐
地址 北京市海淀区海淀大街38号银科大厦16层1601-1608室

专利主权项内容

1.一种文本数据的处理方法,其特征在于,包括:抓取多个媒体资源集的每个媒体资源集中目标媒体资源的文本数据,得到多个文本,其中,所述多个文本与所述多个媒体资源集一一对应;确定所述多个文本中任意两个文本之间的文本相似度值;根据每个文本相对于所述多个文本中其它文本的文本相似度值,确定对应文本的文本准确度值;根据所述多个文本中文本准确度值符合目标条件的文本,对目标媒体资源集中的所述目标媒体资源的文本数据进行处理。