一种音频信息内容识别方法

申请号: CN202410211284.2

申请人: 富迪科技(南京)有限公司

申请日期: 2024/2/27

摘要文本

本发明公开了一种音频信息内容识别方法，涉及音频识别技术领域，本发明提供的方法能够精准对音频信息进行分析，在针对少量用户使用时，能够适应性建立对应用户的习惯数据库，能够识别出系统在识别个人因为习惯发音错误的内容，并针对错误内容进行正确文本的匹配再识别；之后建立一个纠偏的语音信号来调整，后续涉及到声纹识别出来后自动替换纠偏的语音信号来进行识别，使得本申请提供的音频识别更加个性化；本发明简单有效，且易于使用。。更多数据：搜索马克数据网来源：

申请人信息

申请人:富迪科技(南京)有限公司
申请人地址:210003 江苏省南京市鼓楼区广州路228号903室
发明人: 富迪科技(南京)有限公司

专利详细信息

项目	内容
专利名称	一种音频信息内容识别方法
专利类型	发明申请
申请号	CN202410211284.2
申请日	2024/2/27
公告号	CN117789706A
公开日	2024/3/29
IPC主分类号	G10L15/07
权利人	富迪科技(南京)有限公司
发明人	陈国强
地址	江苏省南京市鼓楼区广州路228号903室

专利主权项内容

1.一种音频信息内容识别方法，其特征在于，包括：针对声纹识别后不同的人录入语音进行识别，当同一个人录入语音时，进行录入伴随分析，当接收到录入的语音后，将其标记为存比语音；在预设时间T2分钟内若检测到若干个语音时，标记为跟进语音，根据存比语音和跟进语音二者之间的相似度，当相似度超过B1时，产生处理信号；在产生处理信号时，会根据存比语音对应的存比文本、跟进语音对应的跟进文本二者之间的一致情况挑选出不同的地方，截取对应不同文本的位置的语音，将其标记为误点段，不同文本的位置对应存比语音相应的语音部分标记为误点段，误点段和纠偏文本融合形成核实翻段；持续获取核实翻段，并根据核实翻段更新语音识别模型内相关纠偏文本的语音信号，按照更新后的进行语音识别。

一种音频信息内容识别方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

一种音频信息内容识别方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种用于分布式光伏方法发电的优化配置方法及系统

一种靶向热休克蛋白90的特异性肿瘤诊断探针和显像剂

企业数字化运营多维数据分析方法及系统

用于感知网络中边缘节点健康状态的方法、设备和介质

一种音频信息内容识别方法

一种输水隧洞水下检测机器人及使用方法

热门技术领域

快速入口

专利技术资料

特别鸣谢