← 返回列表

一种语音情感识别方法、装置、电子设备和存储介质

申请号: CN202311757313.7
申请人: 摩尔线程智能科技(北京)有限责任公司
申请日期: 2023/12/19

摘要文本

本公开涉及一种语音情感识别方法、装置、电子设备和存储介质,所述方法包括:对音频进行切分得到时序排列的音频片段;对时序的第i个音频片段进行语义提取,得到语义信息,其中,所述语义信息中融合了前i‑1个视频片段的语义信息,i为大于1的正整数;对第i个音频片段进行说话人识别,得到说话人信息;基于第i‑1个音频片段的情感向量、第i个音频片段的语义信息以及所述说话人信息,得到第i个音频片段的情感向量;根据第i个音频片段的情感向量,得到第i个音频片段的情感类别。本公开实施例可提高语音情感识别的准确率。

专利详细信息

项目 内容
专利名称 一种语音情感识别方法、装置、电子设备和存储介质
专利类型 发明申请
申请号 CN202311757313.7
申请日 2023/12/19
公告号 CN117497009A
公开日 2024/2/2
IPC主分类号 G10L25/63
权利人 摩尔线程智能科技(北京)有限责任公司
发明人 请求不公布姓名; 请求不公布姓名; 请求不公布姓名
地址 北京市海淀区翠微中里14号楼四层B655

专利主权项内容

1.一种语音情感识别方法,其特征在于,包括:对音频进行切分得到时序排列的音频片段;对时序的第i个音频片段进行语义提取,得到语义信息,其中,所述语义信息中融合了前i-1个视频片段的语义信息,i为大于1的正整数;对第i个音频片段进行说话人识别,得到说话人信息;基于第i-1个音频片段的情感向量、第i个音频片段的语义信息以及所述说话人信息,得到第i个音频片段的情感向量;根据第i个音频片段的情感向量,得到第i个音频片段的情感类别。。马 克 数 据 网