基于人工智能的朗读质量测评方法及相关装置
摘要文本
该数据由<马克数据网>整理 本申请涉及语音分析技术领域,提供了基于人工智能的朗读质量测评方法及相关装置,该方法包括对待测评语音数据进行发音测评和语音特征测评,采用该方法能够实现对待测评语音数据的全面测评,提高朗读质量测评的精度,进而提高外语学习者的学习体验。
申请人信息
- 申请人:深圳市妙语教育科技有限公司
- 申请人地址:518000 广东省深圳市福田区莲花街道景华社区景田东路38号中导印刷厂401
- 发明人: 深圳市妙语教育科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于人工智能的朗读质量测评方法及相关装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311689472.8 |
| 申请日 | 2023/12/11 |
| 公告号 | CN117393002B |
| 公开日 | 2024/3/5 |
| IPC主分类号 | G10L25/60 |
| 权利人 | 深圳市妙语教育科技有限公司 |
| 发明人 | 卢隆庆; 傅海峰; 张国勋; 刘朗 |
| 地址 | 广东省深圳市福田区莲花街道景华社区景田东路38号中导印刷厂401 |
专利主权项内容
1.一种基于人工智能的朗读质量测评方法,其特征在于,包括:获取待测评语音数据,并将所述待测评语音数据输入预设的语音分析模型,得到所述待测评语音数据的识别文本集;其中,所述识别文本集包括多个识别文本,各个所述识别文本对应的语言类型互不相同;基于所述识别文本集对所述待测评语音数据进行分析,得到所述待测评语音数据的第一评分值和第一校准信息;在预设的标准语音数据库中获取与所述待测评语音数据匹配的标准语音数据;通过预设的时间窗口分别对所述待测评语音数据和所述标准语音数据进行分帧操作,得到第一帧组序列和第二帧组序列;对所述第一帧组序列和所述第二帧组序列进行分析,得到所述待测评语音数据的第二评分值和第二校准信息;基于所述第一评分值、所述第一校准信息、所述第二评分值和所述第二校准信息生成所述待测评语音数据的评分表,并将所述评分表发送至用户的终端设备;其中,所述语音分析模型包括一个语音识别模块和至少一个语音翻译模块,所述语音识别模块包括第一输入层、第一特征提取层、第一音素识别层、第一语义分析层、第一文本生成层和第一输出层,所述第一输入层用于接收所述待测评语音数据,所述第一特征提取层用于提取所述待测评语音数据的第一特征,所述第一音素识别层用于基于所述第一特征获取所述待测评语音数据的第一音素序列,所述第一语义分析层用于基于所述第一音素序列生成所述待测评语音数据的第一语义信息,所述第一文本生成层用于基于所述第一语义信息生成所述待测评语音数据的第一文本,所述第一输出层用于输出所述第一文本;其中,所述第一文本为所述待测评语音数据对应的语言类型的文本;所述语音翻译模块包括第二输入层、第二特征提取层、第二音素识别层、语义翻译层、第二文本生成层和第二输出层,所述第二输入层用于接收所述待测评语音数据,所述第二特征提取层用于提取所述待测评语音数据的第二特征,所述第二音素识别层用于基于所述第二特征获取所述待测评语音数据的第二音素序列,所述语义翻译层用于基于所述第二音素序列对所述待测评语音数据进行翻译,得到所述待测评语音数据翻译后的第二语义信息,所述第二文本生成层用于基于所述第二语义信息生成所述待测评语音数据的第二文本,所述第二输出层用于输出所述第二文本;当所述语音翻译模块为多个时,各个所述语音翻译模块对应的语言类型互不相同,所述第二文本为将所述待测评语音数据翻译为与其语言类型不同的其他类型的语言时对应的文本。 搜索马 克 数 据 网