← 返回列表

一种人工智能交互方法及人工智能交互系统

申请号: CN202410148487.1
申请人: 江西科技学院
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 一种人工智能交互方法及人工智能交互系统
专利类型 发明申请
申请号 CN202410148487.1
申请日 2024/2/2
公告号 CN117690416A
公开日 2024/3/12
IPC主分类号 G10L13/08
权利人 江西科技学院
发明人 石司马; 顾旭
地址 江西省南昌市高新区瑶湖高校园区紫阳大道115号

摘要文本

关注微信公众号 本发明适用于语音交互技术领域,提供了一种人工智能交互方法及人工智能交互系统,所述方法包括以下步骤:接收目标用户语音输入信息,采集目标用户人脸图像;对目标用户语音输入信息进行分析,得到文字信息、方言信息和语速信息;对目标用户人脸图像进行分析,得到目标性别和目标年龄;根据目标性别和目标年龄确定虚拟人像;根据文字信息、方言信息和语速信息确定交互语音信息,使得虚拟人像发出所述交互语音信息。本发明中,虚拟人像的外形和声音特点更能符合用户的倾听喜好;另外,交互语音信息的方言和说话速度能够与用户的方言和说话速度匹配,使得用户感到亲切,体验感更好。

专利主权项内容

1.一种人工智能交互方法,其特征在于,所述方法包括以下步骤:接收目标用户语音输入信息,采集目标用户人脸图像;对目标用户语音输入信息进行分析,得到文字信息、方言信息和语速信息;对目标用户人脸图像进行分析,得到目标性别和目标年龄;根据目标性别和目标年龄确定虚拟人像;根据文字信息、方言信息和语速信息确定交互语音信息,使得虚拟人像发出所述交互语音信息;所述对目标用户语音输入信息进行分析,得到文字信息、方言信息和语速信息的步骤,具体包括:对目标用户语音输入信息进行文字转化得到文字信息;对目标用户语音输入信息进行方言匹配得到方言信息,所述方言信息为方言类别,当方言匹配失败时,确定方言类别为普通话;提取目标用户语音输入信息的时长,根据时长和文字信息中文字数量确定语速信息;其中,所述根据目标性别和目标年龄确定虚拟人像的步骤,具体包括:将目标性别和目标年龄输入至舒适对象库中,所述舒适对象库包括所有的年龄段,每个年龄段对应有两个性别,每个性别对应有舒适虚拟对象,每个舒适虚拟对象有自己的音色和音调;输出对应的舒适虚拟对象,所述舒适虚拟对象为虚拟人像;其中,输出对应的舒适虚拟对象,所述舒适虚拟对象为虚拟人像的方法包括如下步骤:根据目标用户语音输入信息的情感色彩值,在预设人像着装色彩库中查找对应的人像着装色彩RGB基准值;根据目标用户语音输入信息的情感色彩值,在预设人像着装服饰类型库中查找对应的人像着装服饰类型;根据人像着装色彩RGB基准值、人像着装服饰类型、目标性别与目标年龄,生成舒适虚拟对象。