← 返回列表

一种基于原生声纹特征的拾音翻译方法、设备及存储介质

申请号: CN202311773493.8
申请人: 青岛润恒益科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于原生声纹特征的拾音翻译方法、设备及存储介质
专利类型 发明申请
申请号 CN202311773493.8
申请日 2023/12/21
公告号 CN117727306A
公开日 2024/3/19
IPC主分类号 G10L17/02
权利人 青岛润恒益科技有限公司
发明人 郑晓辉; 牟欣语
地址 山东省青岛市市南区珠海支路1号

摘要文本

本发明公开一种基于原生声纹特征的拾音翻译方法、设备及存储介质,涉及语音识别技术领域。本发明包括,获取原生音频;将原生音频进行分割得到多个原音素以及对应的顺序;获取每个原音素的若干个种类的声纹特征;对原生音频进行语义识别得到原语种文本;将原语种文本翻译为转译语义文本;对转译语义文本进行音素拟合得到多个转译音素以及对应的顺序;根据原音素和对应的顺序以及对应的若干个种类的声纹特征对转译音素进行修正得到转译音频。本发明通过对发言者的原生声纹特征进行识别提取,实现对语音翻译结果的修正,同时实现对翻译结果的润色。

专利主权项内容

1.一种基于原生声纹特征的拾音翻译方法,其特征在于,包括,获取原生音频;将所述原生音频进行分割得到多个原音素以及对应的顺序;获取每个所述原音素的若干个种类的声纹特征,其中,所述声纹特征的种类包括频谱特征、共振峰特征和/或声音强度特征;对所述原生音频进行语义识别得到原语种文本;将所述原语种文本翻译为转译语义文本;对所述转译语义文本进行音素拟合得到多个转译音素以及对应的顺序;根据所述原音素和对应的顺序以及对应的若干个种类的声纹特征对所述转译音素进行修正得到转译音频。