← 返回列表

目标音频识别模型的确定方法、装置及计算设备

申请号: CN202410041950.2
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 目标音频识别模型的确定方法、装置及计算设备
专利类型 发明申请
申请号 CN202410041950.2
申请日 2024/1/11
公告号 CN117558296A
公开日 2024/2/13
IPC主分类号 G10L25/51
权利人 腾讯科技(深圳)有限公司
发明人 许靳昌
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

本申请公开了一种目标音频识别模型的确定方法和装置。在该方法中,首先获取初始音频识别模型。初始音频识别模型利用初始训练样本集对初始深度学习模型进行训练得到,初始训练样本集包括多个训练样本,每个训练样本包括一个音频样本和对应的第一标签,一个音频样本对应的第一标签被设置为表明所述一个音频样本是目标类型的音频。然后,以初始音频识别模型为当前分类模型,对当前分类模型执行调整步骤组以确定目标音频识别模型。调整步骤组用于对当前分类模型进行调整。通过本申请的实施例,可以实现快速、准确且低成本地建立目标音频识别模型,进而用于目标类型的音频的识别。 来源:百度马 克 数据网

专利主权项内容

1.一种目标音频识别模型的确定方法,其特征在于,包括:获取初始音频识别模型,所述初始音频识别模型利用初始训练样本集对初始深度学习模型进行训练得到,所述初始训练样本集包括多个训练样本,每个训练样本包括一个音频样本和对应的第一标签,所述一个音频样本对应的第一标签被设置为表明所述一个音频样本是目标类型的音频;以所述初始音频识别模型为当前分类模型,对所述当前分类模型执行调整步骤组以确定目标音频识别模型,所述目标音频识别模型用于识别目标类型的音频;其中,所述调整步骤组包括迭代执行如下步骤:获取步骤:获取多个测试音频样本,利用当前分类模型对所述测试音频样本进行分类以确定所述测试音频样本对应的分类结果,所述分类结果包括:是目标类型的音频或不是目标类型的音频;确定步骤:确定调整训练样本集,所述调整训练样本集包含多个调整样本,每个调整样本包含被所述当前分类模型分类为目标类型的音频的测试音频样本及所述测试音频样本对应的第二标签,所述第二标签表明所述测试音频样本实际上是否是目标类型的音频;训练步骤:以调整样本的测试音频样本作为输入,调整样本的第二标签作为预期分类结果,利用所述调整训练样本集对所述当前分类模型进行训练以确定中间音频识别模型;验证步骤:验证所述中间音频识别模型用于识别目标类型的音频的准确度,响应于所述准确度小于预定准确度阈值,将所述中间音频识别模型确定为当前分类模型并转到所述获取步骤;响应于所述准确度大于或等于预定准确度阈值,确定所述中间音频识别模型是目标音频识别模型。。详见官网: