← 返回列表

样本数据构建方法及装置

申请号: CN202410109946.5
申请人: 杭州阿里云飞天信息技术有限公司
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 样本数据构建方法及装置
专利类型 发明申请
申请号 CN202410109946.5
申请日 2024/1/25
公告号 CN117633540A
公开日 2024/3/1
IPC主分类号 G06F18/214
权利人 杭州阿里云飞天信息技术有限公司
发明人 吴兵丽; 余海洋; 李永彬; 黄非
地址 浙江省杭州市余杭区五常街道文一西路969号3幢5层553室

摘要文本

本说明书实施例提供样本数据构建方法及装置,其中所述方法包括:确定目标数据以及目标数据中的事项标签数据和事项知识数据;根据事项标签数据和事项知识数据生成知识链路,并基于知识链路确定目标数据的图结构信息;确定事项标签数据中的事项标签子数据,并在知识链路中选择事项标签子数据对应的链路节点,根据链路节点生成图结构信息对应的链路节点组信息;利用图结构信息和链路节点组信息构建目标数据对应的样本对话数据,其中,样本对话数据用于训练对话模型。通过图结构信息和链路节点组信息构建出样本对话数据,利于后续利用样本对话数据训练出更准确的对话模型,为用户提供更好的对话问答服务。

专利主权项内容

1.一种样本数据构建方法,包括:确定目标数据以及所述目标数据中的事项标签数据和事项知识数据;根据所述事项标签数据和所述事项知识数据生成知识链路,并基于所述知识链路确定所述目标数据的图结构信息;确定所述事项标签数据中的事项标签子数据,并在所述知识链路中选择所述事项标签子数据对应的链路节点,根据所述链路节点生成所述图结构信息对应的链路节点组信息;利用所述图结构信息和所述链路节点组信息构建所述目标数据对应的样本对话数据,其中,所述样本对话数据用于训练对话模型。。() (来 自 )