← 返回列表

一种商品评论关键短语提取方法及系统

申请号: CN202410213556.2
申请人: 成都晓多科技有限公司
申请日期: 2024/2/27

摘要文本

本发明公开了一种商品评论关键短语提取方法及系统,属于人工智能神经网络技术领域,该方法包括:提取训练文档中关键词并获取其同义词或/和上位词以构建短语图谱;获取短语图谱中所有节点的词嵌入矩阵;获取待提取的商品评价短语级的向量;获取短语的同义词或/和上位词的注意力机制向量;获取总是同时出现的短语的交叉注意力机制向量;获取当前时间步的输出从而提取出待提取的商品评价中的关键短语。本发明不仅可提取显性的关键词,还可以通过显性词的同义词、上位词找到隐形的关键短语,提高后续商品评价分析的效率和准确性。。关注微信公众号

专利详细信息

项目 内容
专利名称 一种商品评论关键短语提取方法及系统
专利类型 发明申请
申请号 CN202410213556.2
申请日 2024/2/27
公告号 CN117786092A
公开日 2024/3/29
IPC主分类号 G06F16/332
权利人 成都晓多科技有限公司
发明人 请求不公布姓名; 请求不公布姓名
地址 四川省成都市天府新区兴隆街道湖畔路西段123号

专利主权项内容

1.一种商品评论关键短语提取方法,其特征在于包括:提取训练文档中关键词并获取其同义词或/和上位词以构建短语图谱,所述短语图谱中以所述关键词及其同义词或/和上位词作为节点;获取短语图谱中所有节点的词嵌入矩阵;对待提取的商品评价进行编码,获取待提取的商品评价短语级的向量;在解码过程中,通过上一时间步输出的关键词的向量矩阵与词嵌入矩阵之间的注意力权重,获取待提取的商品评价中短语的同义词或/和上位词的注意力机制向量/>;通过注意力机制向量和向量/>的注意力权重,获取总是同时出现的短语的交叉注意力机制向量/>;通过当前时间步的生成概率以及拷贝概率,获取当前时间步的输出从而提取出待提取的商品评价中的关键短语;其中,当前时间步的生成概率基于当前时间步的注意力机制向量获取,当前时间步的拷贝概率基于当前时间步的注意力机制向量/>、向量/>获取。