← 返回列表

一种数字人交互对话方法和系统

申请号: CN202311732973.X
申请人: 卓世未来(天津)科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种数字人交互对话方法和系统
专利类型 发明授权
申请号 CN202311732973.X
申请日 2023/12/18
公告号 CN117423338B
公开日 2024/3/8
IPC主分类号 G10L15/22
权利人 卓世未来(天津)科技有限公司
发明人 赵策; 张玥; 雷媛媛; 孙岩; 潘亮亮; 刘岩
地址 天津市武清区武清开发区福源道北侧创业总部基地C02号楼313室33号

摘要文本

本发明涉及数据处理技术领域,具体涉及一种数字人交互对话方法和系统,包括:获取音频数据;对所有数据点进行迭代自组织聚类,得到第一次聚类结果;获取邻域数据点和参考数据点;获取数据点的局部显著性程度;获取第一数据点;获取数据点和第一数据点的邻域分布曲线;获取数据点与第一数据点的待计算数据点匹配程度;获取待计算数据点;获取数据点的总体显著性程度;根据数据点的总体显著性程度进行聚簇中心更新;根据更新后的聚簇中心进行迭代自组织聚类;根据最终的迭代自组织聚类结果获取数据点的异常程度,根据所述数据点的异常程度获取去噪后的音频数据,并进行音频数据的语义识别,实现准确的语义识别。

专利主权项内容

1.一种数字人交互对话方法,其特征在于,该方法包括以下步骤:获取音频数据;根据获取的音频数据构建二维样本空间,其中二维样本空间中横坐标为时刻,纵坐标为音频数据的振幅值;对所有数据点进行迭代自组织聚类,得到所述聚类过程中第一次聚类结果,其中第一次聚类结果中包含若干聚簇;将任意一个数据点记为目标数据点;预设数据点邻域范围,根据数据点邻域范围获取所述目标数据点的邻域数据点;在第一次聚类结果中,将所述目标数据点所在聚簇中的其他数据点记为目标数据点的参考数据点;根据目标数据点和参考数据点之间的振幅值差异,以及目标数据点和邻域数据点振幅值分布,获取目标数据点的局部显著性程度;对于目标数据点所在聚簇以外的其他聚簇中的任意一个数据点,记为第一数据点;获取目标数据点的邻域分布曲线和第一数据点的邻域分布曲线;根据目标数据点和第一数据点的局部显著性程度的差异,以及邻域分布曲线之间的差异,获取目标数据点与第一数据点的待计算数据点匹配程度;根据待计算数据点匹配程度,获取目标数据点的待计算数据点集合;所述根据目标数据点和第一数据点的局部显著性程度的差异,以及邻域分布曲线之间的差异,获取目标数据点与第一数据点的待计算数据点匹配程度,包括的具体步骤如下:对目标数据点的邻域分布曲线和第一数据点的邻域分布曲线进行dtw匹配,获取目标数据点的邻域分布曲线和第一数据点的邻域分布曲线之间的dtw距离;记目标数据点为第个聚簇的第/>个数据点/>,第一数据点为第/>个聚簇的第/>个数据点,则/>是/>的待计算数据点匹配程度/>的计算方法为:其中,表示第/>个聚簇的第/>个数据点的邻域分布曲线;/>表示第/>个聚簇的第/>个数据点的邻域分布曲线;/>表示邻域分布曲线/>和邻域分布曲线/>之间的dtw距离;/>表示第/>个聚簇的第/>个数据点的局部显著性程度;/>表示第/>个聚簇的第/>个数据点的局部显著性程度;/>表示以自然常数为底数的指数函数;根据目标数据点与待计算数据点集合中待计算数据点的聚簇差异以及局部显著性程度的差异获取目标数据点的总体显著性程度;所述根据目标数据点与待计算数据点集合中待计算数据点的聚簇差异以及局部显著性程度的差异获取目标数据点的总体显著性程度,包括的具体步骤如下:将待计算数据点集合中的待计算数据点所在聚簇,记为待计算聚簇;对于目标数据点的待计算数据点集合中的任意一个待计算数据点,获取所述待计算数据点所在的聚簇与目标数据点所在的聚簇之间的归一化互信息值;根据所述待计算数据点所在的聚簇与目标数据点所在的聚簇之间的归一化互信息值获取目标数据点的总体显著性程度;所述获取目标数据点的总体显著性程度,包括的具体步骤如下:记目标数据点为第个聚簇的第/>个数据点,所述目标数据点的总体显著性程度/>的计算方法为:其中,表示待计算聚簇的数量;/>表示第/>个聚簇的第/>个数据点所在聚簇与第个待计算聚簇之间的归一化互信息值;/>表示第/>个待计算聚簇中待计算数据点的数量;表示第/>个待计算聚簇中第/>个待计算数据点的局部显著性程度;/>表示第/>个待计算聚簇中第/>个待计算数据点的所有参考数据点的局部显著性程度的均值;/>表示第/>个待计算聚簇中第/>个待计算数据点与所述待计算数据点的所有参考数据点的局部显著性程度的方差值;/>表示第/>个聚簇的第/>个数据点的局部显著性程度;/>表示第/>个聚簇的第/>个数据点的所有参考数据点的局部显著性程度的均值;/>表示第/>个聚簇的第个数据点与所述数据点的所有参考数据点的局部显著性程度的方差值;/>表示以自然常数为底数的指数函数;根据目标数据点的总体显著性程度进行迭代自组织聚类的第一次聚类结果的聚簇中心的更新;根据更新后的聚簇中心进行下一次迭代自组织聚类;依次类推,得到最终的迭代自组织聚类结果;根据最终的迭代自组织聚类结果获取数据点的异常程度,根据所述数据点的异常程度获取去噪后的音频数据,并进行音频数据的语义识别。