一种图像识别的安全防御方法、装置和计算机设备
摘要文本
本申请涉及一种图像识别的安全防御方法、装置和计算机设备。所述方法包括:在原图像识别模型的原始样本集中加入与原图像识别模型的梯度相反的噪音,得到模型训练集;随机抽取预设数量的模型训练集中的图像数据,分别输入到各个子专家网络模型中,得到数据特征;计算此组图像数据的准确率交叉熵损失函数、差异性损失函数和焦点稳定性损失函数;基于此组图像数据的准确率交叉熵损失函数、差异性损失函数和焦点稳定性损失函数,利用梯度下降法对多专家网络模型的参数进行更新;当多专家网络模型收敛时,得到用于图像识别的完备多专家网络模型。采用本方法能够解决现有技术中存在人工智能模型对于黑客攻击的防御效果差问题。 微信公众号马克 数据网
申请人信息
- 申请人:之江实验室
- 申请人地址:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室
- 发明人: 之江实验室
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种图像识别的安全防御方法、装置和计算机设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311326470.2 |
| 申请日 | 2023/10/13 |
| 公告号 | CN117058493B |
| 公开日 | 2024/2/13 |
| IPC主分类号 | G06V10/774 |
| 权利人 | 之江实验室 |
| 发明人 | 韩乔; 黄勇; 杨耀; 翟毅腾 |
| 地址 | 浙江省杭州市余杭区中泰街道科创大道之江实验室 |
专利主权项内容
1.一种图像识别的安全防御方法,其特征在于,所述方法包括:在原图像识别模型的原始样本集中加入与所述原图像识别模型的梯度相反的噪音,得到所述原图像识别模型的攻击样本集;将所述原始样本集的训练集和所述攻击样本集的训练集合并,得到模型训练集;随机抽取预设数量的所述模型训练集中的图像数据,作为一组图像数据,分别输入到多专家网络模型的各个子专家网络模型中,得到各个图像数据的数据特征;所述多专家网络模型的各个子专家网络模型,为对原图像识别模型进行复制得到的复制后的原图像识别模型;基于各个所述图像数据的所述数据特征,计算此组所述图像数据的准确率交叉熵损失函数以及各个所述图像数据的所述数据特征的像素级热力图;所述准确率交叉熵损失函数L的计算公式为:;其中,t是用于训练的监督值,i表示第i分类,/>为所述子专家网络模型识别出被识别的图像数据是否属于第i分类的概率;并根据各个所述图像数据的所述数据特征的像素级热力图,计算此组所述图像数据的差异性损失函数和焦点稳定性损失函数;所述差异性损失函数L的计算公式为:;其中,m为子所述专家网络模型的个数,m为正整数,a表示第a个子专家网络模型,b表示第b个子专家网络模型,I表示第a个子专家网络模型坐标为(x,y)的像素点的特征重要度,I表示第b个子专家网络模型坐标为(x,y)的像素点的特征重要度;所述焦点稳定性损失函数的计算公式L为:;其中,X表示第a个子专家网络模型的焦点的横坐标,X的定义为:/>,Y表示第a个子专家网络模型的焦点的纵坐标,Y的定义为:/>,X表示第b个子专家网络模型的焦点的横坐标,X的定义为:/>,Y表示第b个子专家网络模型的焦点的纵坐标,Y的定义为:/>;0i1axybxy2aaaabbbb基于此组所述图像数据的所述准确率交叉熵损失函数、所述差异性损失函数和所述焦点稳定性损失函数,利用梯度下降法对所述多专家网络模型的参数进行更新;当所述多专家网络模型收敛时,得到用于图像识别的完备多专家网络模型。