← 返回列表

一种用于智慧监管的多目标监测方法

申请号: CN202410174622.X
申请人: 深圳市科荣软件股份有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种用于智慧监管的多目标监测方法
专利类型 发明申请
申请号 CN202410174622.X
申请日 2024/2/7
公告号 CN117727329A
公开日 2024/3/19
IPC主分类号 G10L25/51
权利人 深圳市科荣软件股份有限公司
发明人 马进泉; 张昭君; 陈尔锋
地址 广东省深圳市罗湖区翠竹街道翠宁社区太宁路85号科技大厦主楼401室

摘要文本

本发明公开了一种用于智慧监管的多目标监测方法,属于语音处理技术领域,本发明将原始声音信号进行分段,得到多个子段声音信号,对每个子段声音信号进行小波分解,得到各个子段声音信号的小波分解系数向量,小波分解系数体现的是信号的成分,从而更容易体现声音信号的组成结构,一方面能减少数据量,另一方面能凸显信号的结构,再进行说话人数预测,在数据量大大减少后,人数预测模型结构更简单,计算量更小。找到预测说话人数为1对应的小波分解系数向量,再重构,得到个人的时域声音信号,根据个人的时域声音信号的信号特征,从原始声音信号中找出各个个体的说话声音时段,实现各个说话目标的说话监测。

专利主权项内容

1.一种用于智慧监管的多目标监测方法,其特征在于,包括以下步骤:S1、录取环境中的原始声音信号;S2、对原始声音信号进行分段,得到多个子段声音信号;S3、对每个子段声音信号进行小波分解,得到多个小波分解系数向量,其中,每个小波分解系数向量由一个子段声音信号对应的小波分解系数构成;S4、将每个小波分解系数向量输入人数预测模型,预测说话人数;S5、提取预测说话人数为1对应的小波分解系数向量,作为个体分解系数向量;S6、对个体分解系数向量进行重构,得到个体时域声音信号;S7、根据个体时域声音信号的信号特征,找到原始声音信号中各个个体的说话声音时段。 来源:百度马 克 数据网