← 返回列表

文本数据的处理方法、装置和计算机可读存储介质

申请号: CN201810198838.4
申请人: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
更新日期: 2026-03-08

专利详细信息

项目 内容
专利名称 文本数据的处理方法、装置和计算机可读存储介质
专利类型 发明授权
申请号 CN201810198838.4
申请日 2018年3月12日
公告号 CN110309251B
公开日 2024年1月12日
IPC主分类号 G06F16/31
权利人 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
发明人 温程
地址 北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层; 北京市大兴区北京经济技术开发区科创十一街18号C座2层201室

摘要文本

北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司取得“一种透气窗帘布”专利技术,本公开涉及一种文本数据的处理方法、装置和计算机可读存储介质,涉及自然语言处理技术领域。该方法包括:获取文本数据中包含的关键词和实体;根据关键词和实体,确定文本数据的分类信息;根据关键词、实体和分类信息,创建文本数据的文本索引;根据文本数据中各句子包含的关键词和实体,创建各句子的句子索引;利用文本索引,确定目标事件的相关文本数据;利用句子索引,在相关文本数据中确定目标事件的匹配句子;计算匹配句子中与目标事件匹配的关键词的匹配权重;根据匹配权重和第一阈值,确定与目标事件相关的关键词。本公开的技术方案能够提高事件查询准确性。 来自专利查询网

专利主权项内容

1.一种文本数据的处理方法,包括:获取文本数据中包含的关键词和实体;根据所述关键词和所述实体,确定所述文本数据的分类信息;根据所述关键词、所述实体和所述分类信息,创建所述文本数据的文本索引;根据所述文本数据中各句子包含的所述关键词和所述实体,创建所述各句子的句子索引;利用所述文本索引,确定目标事件的相关文本数据;利用所述句子索引,在所述相关文本数据中确定所述目标事件的匹配句子;计算所述匹配句子中与所述目标事件匹配的关键词的匹配权重;根据所述匹配权重和第一阈值,确定与所述目标事件相关的关键词。