一种深度语音特征的构建及心理健康筛查方法

申请号: CN202311515912.8

申请人: 首都师范大学

申请日期: 2023/11/14

摘要文本

本发明提出一种深度语音特征的构建及心理健康筛查方法，包括，获取语音数据，对语音数据进行预处理；对预处理后的语音数据进行快速傅里叶变换得到功率谱，对功率谱应用梅尔滤波器组并取对数得到梅尔谱图；对于每个帧的对数梅尔谱图，计算其一阶和二阶差分；根据得到的对数梅尔谱图及其一阶和二阶差分构建三通道图像；对三通道图像进行处理以提取深度时序特征和深度空间特征；将深度时序特征与深度空间特征进行拼接并使用全连接层进行降维，从而得到融合语音特征；对融合语音特征，采用包含多任务学习策略的预测网络进行心理健康的筛查及严重程度的预测。通过本发明提出的方法，能够应用于心理与精神健康监测，实现早发现、早干预、早治疗。

申请人信息

申请人:首都师范大学
申请人地址:100037 北京市海淀区西三环北路105号
发明人: 首都师范大学

专利详细信息

项目	内容
专利名称	一种深度语音特征的构建及心理健康筛查方法
专利类型	发明申请
申请号	CN202311515912.8
申请日	2023/11/14
公告号	CN117765980A
公开日	2024/3/26
IPC主分类号	G10L25/63
权利人	首都师范大学
发明人	邵珠宏; 张佐闱; 尚媛园; 李世豪; 胡强; 张岩丽; 宋巍; 谭小慧; 梁佩鹏
地址	北京市海淀区西三环北路105号

专利主权项内容

1.一种深度语音特征的构建及心理健康筛查方法，其特征在于，包括以下步骤：获取语音数据，对所述语音数据进行预处理；对预处理后的语音数据进行快速傅里叶变换得到功率谱，对所述功率谱应用梅尔滤波器组并取对数得到梅尔谱图；对于每个帧的对数梅尔谱图，计算其一阶和二阶差分；根据得到的对数梅尔谱图及其一阶和二阶差分构建三通道图像；对所述三通道图像进行处理以提取深度时序特征和深度空间特征；将所述深度时序特征与所述深度空间特征进行拼接并使用全连接层进行降维，从而得到融合语音特征；对所述融合语音特征，采用包含多任务学习策略的预测网络进行心理健康的筛查及严重程度的预测。

一种深度语音特征的构建及心理健康筛查方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

一种深度语音特征的构建及心理健康筛查方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢