← 返回列表
一种用于体育比赛直播文字的体育新闻构建方法及系统
申请人信息
- 申请人:北京奥邦菲特科技有限公司
- 申请人地址:100000 北京市大兴区隆华大街55号院7号楼10层1037
- 发明人: 北京奥邦菲特科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种用于体育比赛直播文字的体育新闻构建方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311570259.5 |
| 申请日 | 2023/11/23 |
| 公告号 | CN117633150A |
| 公开日 | 2024/3/1 |
| IPC主分类号 | G06F16/33 |
| 权利人 | 北京奥邦菲特科技有限公司 |
| 发明人 | 孙立平; 孙洪涛 |
| 地址 | 北京市大兴区隆华大街55号院7号楼10层1037 |
摘要文本
本发明涉及新闻构建技术领域,公开了一种用于体育比赛直播文字的体育新闻构建方法及系统。本发明首先基于直播文字的种类进行术语定义,并根据定义的术语对实时收集的直播文字进行预处理,提取直播文字中的关键词,并计算该关键词在直播文字中的权重。同时,根据实时收集到的直播文字中的关键词判断其与数据库中保存的新闻的相似程度,基于相似程度判断该直播文字是否是独立新闻;进而,通过不断实时收集直播文字和不断更新直播文字的关键词集合,判断该值直播文字所属新闻树情况,并基于所属新闻树情况构建直播新闻,提高了直播新闻的相关性和实时性。
专利主权项内容
1.一种用于体育比赛直播文字的体育新闻构建方法,其特征在于,包括以下步骤:S1、基于体育直播文字的种类进行术语定义,所述术语定义包括体育术语定义和直播文字术语定义;S2、当接收到新的体育直播文字时,基于体育直播文字的种类对接收到的直播文字进行数据预处理;S3、继续接收新的体育直播文字并提取直播文字中的直播文字关键词,并反馈更新直播文字关键词;S4、提取出直播文字关键词后通过聚类算法聚类出该直播文字中的子事件,并基于聚类出该直播文字中的子事件提取每个子事件中的事件关键词;S5、根据实时更新事件关键词判断是否需要合并某些子事件,当实时更新的事件关键词集合与数据库中保存的各项事件关键词集合的差异超过设定的阈值时,不合并,反之,则合并,所述事件关键词是对直播文字关键词聚类后的关键词,所述数据库中保存的各项事件关键词集合来源于爬取大量体育比赛直播文字和对应比赛的新闻;S6、基于事件发生时间先后顺序将事件连接起来,构建完整的体育直播文字。