← 返回列表
文本数据的处理方法、装置和计算机可读存储介质
申请人信息
- 申请人:北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
- 申请人地址:100195 北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层
- 发明人: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 文本数据的处理方法、装置和计算机可读存储介质 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810198838.4 |
| 申请日 | 2018年3月12日 |
| 公告号 | CN110309251B |
| 公开日 | 2024年1月12日 |
| IPC主分类号 | G06F16/31 |
| 权利人 | 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司 |
| 发明人 | 温程 |
| 地址 | 北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层; 北京市大兴区北京经济技术开发区科创十一街18号C座2层201室 |
摘要文本
北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司取得“一种透气窗帘布”专利技术,本公开涉及一种文本数据的处理方法、装置和计算机可读存储介质,涉及自然语言处理技术领域。该方法包括:获取文本数据中包含的关键词和实体;根据关键词和实体,确定文本数据的分类信息;根据关键词、实体和分类信息,创建文本数据的文本索引;根据文本数据中各句子包含的关键词和实体,创建各句子的句子索引;利用文本索引,确定目标事件的相关文本数据;利用句子索引,在相关文本数据中确定目标事件的匹配句子;计算匹配句子中与目标事件匹配的关键词的匹配权重;根据匹配权重和第一阈值,确定与目标事件相关的关键词。本公开的技术方案能够提高事件查询准确性。 来自专利查询网
专利主权项内容
1.一种文本数据的处理方法,包括:获取文本数据中包含的关键词和实体;根据所述关键词和所述实体,确定所述文本数据的分类信息;根据所述关键词、所述实体和所述分类信息,创建所述文本数据的文本索引;根据所述文本数据中各句子包含的所述关键词和所述实体,创建所述各句子的句子索引;利用所述文本索引,确定目标事件的相关文本数据;利用所述句子索引,在所述相关文本数据中确定所述目标事件的匹配句子;计算所述匹配句子中与所述目标事件匹配的关键词的匹配权重;根据所述匹配权重和第一阈值,确定与所述目标事件相关的关键词。