← 返回列表
声纹处理方法、装置、设备、存储介质和程序产品
摘要文本
本申请提供一种声纹处理方法、装置、设备、存储介质和程序产品,包括:获取目标歌手的目标歌曲;对目标歌曲进行特征提取,得到第一声学特征;将第一声学特征输入至歌手声纹提取模型,以通过歌手声纹提取模型对第一声学特征进行特征提取,得到多个第一特征向量,对多个第一特征向量进行人声检测,确定多个第一特征向量中目标歌曲中人声部分对应的多个第一人声向量,对多个第一人声向量进行处理,得到目标歌手的第一声纹信息;其中,歌手声纹提取模型是基于歌曲数据训练得到。以提高确定歌手声纹的准确性,降低确定歌手声纹的成本。
申请人信息
- 申请人:杭州网易云音乐科技有限公司
- 申请人地址:310052 浙江省杭州市萧山区钱江世纪城奔竞大道353号杭州国际博览中心A座1201室
- 发明人: 杭州网易云音乐科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 声纹处理方法、装置、设备、存储介质和程序产品 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311690367.6 |
| 申请日 | 2023/12/11 |
| 公告号 | CN117392986A |
| 公开日 | 2024/1/12 |
| IPC主分类号 | G10L17/02 |
| 权利人 | 杭州网易云音乐科技有限公司 |
| 发明人 | 金强; 李宜烜; 陈锦海; 刘华平; 李鹏; 赵翔宇 |
| 地址 | 浙江省杭州市萧山区钱江世纪城奔竞大道353号杭州国际博览中心A座1201室 |
专利主权项内容
1.一种声纹处理方法,其特征在于,包括:获取目标歌手的目标歌曲;对所述目标歌曲进行特征提取,得到第一声学特征;将所述第一声学特征输入至歌手声纹提取模型,以通过所述歌手声纹提取模型对所述第一声学特征进行特征提取,得到多个第一特征向量,对所述多个第一特征向量进行人声检测,确定所述多个第一特征向量中所述目标歌曲中人声部分对应的多个第一人声向量,对所述多个第一人声向量进行处理,得到所述目标歌手的第一声纹信息;其中,所述歌手声纹提取模型是基于歌曲数据训练得到。