← 返回列表

一种音频信息内容识别方法

申请号: CN202410211284.2
申请人: 富迪科技(南京)有限公司
申请日期: 2024/2/27

摘要文本

本发明公开了一种音频信息内容识别方法,涉及音频识别技术领域,本发明提供的方法能够精准对音频信息进行分析,在针对少量用户使用时,能够适应性建立对应用户的习惯数据库,能够识别出系统在识别个人因为习惯发音错误的内容,并针对错误内容进行正确文本的匹配再识别;之后建立一个纠偏的语音信号来调整,后续涉及到声纹识别出来后自动替换纠偏的语音信号来进行识别,使得本申请提供的音频识别更加个性化;本发明简单有效,且易于使用。。更多数据:搜索马克数据网来源:

专利详细信息

项目 内容
专利名称 一种音频信息内容识别方法
专利类型 发明申请
申请号 CN202410211284.2
申请日 2024/2/27
公告号 CN117789706A
公开日 2024/3/29
IPC主分类号 G10L15/07
权利人 富迪科技(南京)有限公司
发明人 陈国强
地址 江苏省南京市鼓楼区广州路228号903室

专利主权项内容

1.一种音频信息内容识别方法,其特征在于,包括:针对声纹识别后不同的人录入语音进行识别,当同一个人录入语音时,进行录入伴随分析,当接收到录入的语音后,将其标记为存比语音;在预设时间T2分钟内若检测到若干个语音时,标记为跟进语音,根据存比语音和跟进语音二者之间的相似度,当相似度超过B1时,产生处理信号;在产生处理信号时,会根据存比语音对应的存比文本、跟进语音对应的跟进文本二者之间的一致情况挑选出不同的地方,截取对应不同文本的位置的语音,将其标记为误点段,不同文本的位置对应存比语音相应的语音部分标记为误点段,误点段和纠偏文本融合形成核实翻段;持续获取核实翻段,并根据核实翻段更新语音识别模型内相关纠偏文本的语音信号,按照更新后的进行语音识别。