基于机器阅读理解的中文方面级情感分析方法及系统
摘要文本
本发明提供一种基于机器阅读理解的中文方面级情感分析方法及系统,通过获取待分析的评论文本和查询文本;将所获取的所述评论文本和查询文本采用标记符号进行拼接,作为输入文本;对输入文本利用全词覆盖的中文预训练语言模型进行嵌入编码,获得输入文本的初始特征表示;对所述输入文本的初始特征表示进行语义特征提取,利用GCN神经网络对所述输入文本的编码表示进行语法特征提取;并获得输入文本的最终特征表示;将输入文本的最终特征表示输入中文方面级情感多任务分析模型进行方面级情感四元组为主的多任务预测;本发明达到了对用户评论文本中完整情感元素信息的有效预测的技术效果。 专利查询网
申请人信息
- 申请人:中国传媒大学
- 申请人地址:100024 北京市朝阳区定福庄东街1号
- 发明人: 中国传媒大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于机器阅读理解的中文方面级情感分析方法及系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311639036.X |
| 申请日 | 2023/12/4 |
| 公告号 | CN117390140B |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06F16/33 |
| 权利人 | 中国传媒大学 |
| 发明人 | 殷复莲; 冯小丽; 武岳巍; 吴肇良; 邢彤彤; 付睿翎; 余振宇 |
| 地址 | 北京市朝阳区定福庄东街1号 |
专利主权项内容
1.一种基于机器阅读理解的中文方面级情感分析方法,其特征在于,包括:获取待分析的评论文本和所述评论文本对应的机器学习的查询文本;其中,所述评论文本对应的机器学习的查询文本的获取方式包括,对评论文本进行方面-意见双向提取查询,通过获取所述评论文本的从方面术语到意见术语方向的信息数据以及所述评论文本的从意见术语到方面术语方向的信息数据,确定所述评论文本中方面术语和意见术语在所在句子中的定位;对已确定方面术语和意见术语在所在句子中的定位的评论文本,进行给定方面术语的条件下的限制性方面类别分类查询和给定意见术语的条件下的限制性情感极性分类查询,确定所述评论文本的方面所属的方面类别和意见所表达的情感极性;将所述评论文本对应的方面-意见双向提取查询、限制性方面类别分类查询以及限制性情感极性分类查询的文本作为查询文本;将所述评论文本和所述查询文本采用标记符号进行拼接,作为输入文本;对所述输入文本利用预设的全词覆盖的中文预训练语言模型进行嵌入编码,获得所述输入文本的初始特征表示;利用预设的Bi-LSTM神经网络对所述输入文本的初始特征表示进行语义特征提取,获得所述输入文本的编码表示;利用预设的GCN神经网络对所述输入文本的编码表示进行语法特征提取;并根据所提取的语义特征和语法特征获得输入文本的最终特征表示;将所述最终特征表示输入预设的中文方面级情感多任务分析模型,进行方面级情感分析,并获得以方面级情感四元组为主,还包含方面情感三元组、方面情感二元组以及单一情感元素的多任务预测结果。 (来 自 马 克 数 据 网)