← 返回列表

一种算子处理模型的训练方法和相关装置

申请号: CN202410061762.6
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种算子处理模型的训练方法和相关装置
专利类型 发明申请
申请号 CN202410061762.6
申请日 2024/1/16
公告号 CN117574983A
公开日 2024/2/20
IPC主分类号 G06N3/08
权利人 腾讯科技(深圳)有限公司
发明人 刘强; 张超; 杨晓峰; 陈鹏; 刘煜宏
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

本申请实施例公开了一种算子处理模型的训练方法和相关装置,可应用于云技术、人工智能等场景。获取算子、样本输入参数和第一测试结果,样本输入参数用于描述算子的输入数据的数据维度,第一测试结果是通过目标加速卡测试算子,且算子是基于样本输入参数进行测试得到的真实结果。根据算子和样本输入参数,通过初始算子处理模型进行预测,得到第一预测结果,即算子基于样本输入参数通过目标加速卡进行测试得到的理论结果。基于最小化目标差异的训练方向,即令第一预测结果和第一测试结果之间的差异最小,调整初始算子处理模型的参数,得到算子处理模型,使得其可以较为准确地预测到算子基于不同输入参数通过目标测试卡进行测试的理论结果。

专利主权项内容

1.一种算子处理模型的训练方法,其特征在于,所述方法包括:获取算子、样本输入参数和第一测试结果,所述样本输入参数用于描述所述算子的输入数据的数据维度,所述第一测试结果为所述算子基于所述样本输入参数通过目标加速卡进行测试得到的真实结果;根据所述算子和所述样本输入参数,通过初始算子处理模型进行预测,得到第一预测结果,所述第一预测结果为所述算子基于所述样本输入参数通过所述目标加速卡进行测试得到的理论结果;基于最小化目标差异的训练方向,调整所述初始算子处理模型的参数,得到算子处理模型,所述目标差异为所述第一预测结果和所述第一测试结果之间的差异,所述算子处理模型用于预测所述算子基于不同输入参数通过所述目标加速卡进行测试得到的理论结果。