← 返回列表
一种语音情感识别方法、装置、电子设备和存储介质
摘要文本
本公开涉及一种语音情感识别方法、装置、电子设备和存储介质,所述方法包括:对音频进行切分得到时序排列的音频片段;对时序的第i个音频片段进行语义提取,得到语义信息,其中,所述语义信息中融合了前i‑1个视频片段的语义信息,i为大于1的正整数;对第i个音频片段进行说话人识别,得到说话人信息;基于第i‑1个音频片段的情感向量、第i个音频片段的语义信息以及所述说话人信息,得到第i个音频片段的情感向量;根据第i个音频片段的情感向量,得到第i个音频片段的情感类别。本公开实施例可提高语音情感识别的准确率。
申请人信息
- 申请人:摩尔线程智能科技(北京)有限责任公司
- 申请人地址:100080 北京市海淀区翠微中里14号楼四层B655
- 发明人: 摩尔线程智能科技(北京)有限责任公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种语音情感识别方法、装置、电子设备和存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311757313.7 |
| 申请日 | 2023/12/19 |
| 公告号 | CN117497009A |
| 公开日 | 2024/2/2 |
| IPC主分类号 | G10L25/63 |
| 权利人 | 摩尔线程智能科技(北京)有限责任公司 |
| 发明人 | 请求不公布姓名; 请求不公布姓名; 请求不公布姓名 |
| 地址 | 北京市海淀区翠微中里14号楼四层B655 |
专利主权项内容
1.一种语音情感识别方法,其特征在于,包括:对音频进行切分得到时序排列的音频片段;对时序的第i个音频片段进行语义提取,得到语义信息,其中,所述语义信息中融合了前i-1个视频片段的语义信息,i为大于1的正整数;对第i个音频片段进行说话人识别,得到说话人信息;基于第i-1个音频片段的情感向量、第i个音频片段的语义信息以及所述说话人信息,得到第i个音频片段的情感向量;根据第i个音频片段的情感向量,得到第i个音频片段的情感类别。。马 克 数 据 网