← 返回列表
一种音频信息内容识别方法
摘要文本
本发明公开了一种音频信息内容识别方法,涉及音频识别技术领域,本发明提供的方法能够精准对音频信息进行分析,在针对少量用户使用时,能够适应性建立对应用户的习惯数据库,能够识别出系统在识别个人因为习惯发音错误的内容,并针对错误内容进行正确文本的匹配再识别;之后建立一个纠偏的语音信号来调整,后续涉及到声纹识别出来后自动替换纠偏的语音信号来进行识别,使得本申请提供的音频识别更加个性化;本发明简单有效,且易于使用。。更多数据:搜索马克数据网来源:
申请人信息
- 申请人:富迪科技(南京)有限公司
- 申请人地址:210003 江苏省南京市鼓楼区广州路228号903室
- 发明人: 富迪科技(南京)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种音频信息内容识别方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410211284.2 |
| 申请日 | 2024/2/27 |
| 公告号 | CN117789706A |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G10L15/07 |
| 权利人 | 富迪科技(南京)有限公司 |
| 发明人 | 陈国强 |
| 地址 | 江苏省南京市鼓楼区广州路228号903室 |
专利主权项内容
1.一种音频信息内容识别方法,其特征在于,包括:针对声纹识别后不同的人录入语音进行识别,当同一个人录入语音时,进行录入伴随分析,当接收到录入的语音后,将其标记为存比语音;在预设时间T2分钟内若检测到若干个语音时,标记为跟进语音,根据存比语音和跟进语音二者之间的相似度,当相似度超过B1时,产生处理信号;在产生处理信号时,会根据存比语音对应的存比文本、跟进语音对应的跟进文本二者之间的一致情况挑选出不同的地方,截取对应不同文本的位置的语音,将其标记为误点段,不同文本的位置对应存比语音相应的语音部分标记为误点段,误点段和纠偏文本融合形成核实翻段;持续获取核实翻段,并根据核实翻段更新语音识别模型内相关纠偏文本的语音信号,按照更新后的进行语音识别。