← 返回列表
一种舆情数据的新闻主体识别方法及系统
申请人信息
- 申请人:易方达基金管理有限公司
- 申请人地址:519000 广东省珠海市横琴新区荣粤道188号6层
- 发明人: 易方达基金管理有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种舆情数据的新闻主体识别方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311503045.6 |
| 申请日 | 2023/11/10 |
| 公告号 | CN117592471A |
| 公开日 | 2024/2/23 |
| IPC主分类号 | G06F40/289 |
| 权利人 | 易方达基金管理有限公司 |
| 发明人 | 单怡然; 刘硕凌; 程宁; 杨澎涛; 王昱森 |
| 地址 | 广东省珠海市横琴新区荣粤道188号6层 |
摘要文本
易方达基金管理有限公司取得“一种透气窗帘布”专利技术,本发明公开了一种舆情数据的新闻主体识别方法及系统,方法包括将新闻舆情数据通过AI大模型进行主体名称识别,得到舆情特征识别结果;其中,AI大模型通过基于上下文指令对ChatGPT模型进行数据训练而得到;通过对舆情特征识别结果进行字符串匹配,判断舆情特征识别结果中是否存在新闻主体,若不存在,则输出未识别出主体的提示信息;若存在,则将舆情特征识别结果进行无效信息剔除,得到主体简化数据,并对主体简化数据进行主体数量判别分割,获得主体简化名称;通过公共子序列最优匹配策略,将主体简化名称与预先构建的公司知识库进行匹配,输出新闻主体名称识别结果。本实施例实现在海量新闻舆情信息中高效提取主体公司名称,提高主体识别的精准性。
专利主权项内容
1.一种舆情数据的新闻主体识别方法,其特征在于,包括:将新闻舆情数据通过AI大模型进行主体名称识别,得到舆情特征识别结果;其中,所述AI大模型通过基于上下文指令对ChatGPT模型进行数据训练而得到;通过对所述舆情特征识别结果进行字符串匹配,判断所述舆情特征识别结果中是否存在新闻主体,若不存在,则输出未识别出主体的提示信息;若存在,则将所述舆情特征识别结果进行无效信息剔除,得到主体简化数据,并对所述主体简化数据进行主体数量判别分割,获得主体简化名称;通过公共子序列最优匹配策略,将所述主体简化名称与预先构建的公司知识库进行匹配,得到新闻主体名称识别结果,并输出所述新闻主体名称识别结果;其中,所述主体简化名称至少为1个。