← 返回列表

一种深度语音特征的构建及心理健康筛查方法

申请号: CN202311515912.8
申请人: 首都师范大学
申请日期: 2023/11/14

摘要文本

本发明提出一种深度语音特征的构建及心理健康筛查方法,包括,获取语音数据,对语音数据进行预处理;对预处理后的语音数据进行快速傅里叶变换得到功率谱,对功率谱应用梅尔滤波器组并取对数得到梅尔谱图;对于每个帧的对数梅尔谱图,计算其一阶和二阶差分;根据得到的对数梅尔谱图及其一阶和二阶差分构建三通道图像;对三通道图像进行处理以提取深度时序特征和深度空间特征;将深度时序特征与深度空间特征进行拼接并使用全连接层进行降维,从而得到融合语音特征;对融合语音特征,采用包含多任务学习策略的预测网络进行心理健康的筛查及严重程度的预测。通过本发明提出的方法,能够应用于心理与精神健康监测,实现早发现、早干预、早治疗。

专利详细信息

项目 内容
专利名称 一种深度语音特征的构建及心理健康筛查方法
专利类型 发明申请
申请号 CN202311515912.8
申请日 2023/11/14
公告号 CN117765980A
公开日 2024/3/26
IPC主分类号 G10L25/63
权利人 首都师范大学
发明人 邵珠宏; 张佐闱; 尚媛园; 李世豪; 胡强; 张岩丽; 宋巍; 谭小慧; 梁佩鹏
地址 北京市海淀区西三环北路105号

专利主权项内容

1.一种深度语音特征的构建及心理健康筛查方法,其特征在于,包括以下步骤:获取语音数据,对所述语音数据进行预处理;对预处理后的语音数据进行快速傅里叶变换得到功率谱,对所述功率谱应用梅尔滤波器组并取对数得到梅尔谱图;对于每个帧的对数梅尔谱图,计算其一阶和二阶差分;根据得到的对数梅尔谱图及其一阶和二阶差分构建三通道图像;对所述三通道图像进行处理以提取深度时序特征和深度空间特征;将所述深度时序特征与所述深度空间特征进行拼接并使用全连接层进行降维,从而得到融合语音特征;对所述融合语音特征,采用包含多任务学习策略的预测网络进行心理健康的筛查及严重程度的预测。