← 返回列表

基于可变形锚框的中小学课堂行为检测方法及装置

申请号: CN202311292709.9
申请人: 淮阴工学院; 张雅琼; 李怡萱
申请日期: 2023/10/7

摘要文本

本发明公开了基于可变形锚框的中小学课堂行为检测方法及装置。对原始课堂监控图像进行预处理,对图像进行标注和划分为课堂行为数据集SData。然后使用YOLOv8的骨干网络对数据集SData进行提取特征,输出多尺度特征图。将80×80×256的特征图输入可变形锚框模块CAF,输出可变形锚框的参数。40×40×512的特征图经上下文信息模块提取语义特征,并与原始特征一起输入YOLOv8颈部进行特征融合,生成矩形框。在后处理阶段,对预测框应用偏移量调整坐标,生成最终预测框。与现有技术相比,本发明结合可变形锚框和语义信息提取,增强了模型对复杂课堂场景的适应性,使行为检测更加准确高效。

专利详细信息

项目 内容
专利名称 基于可变形锚框的中小学课堂行为检测方法及装置
专利类型 发明申请
申请号 CN202311292709.9
申请日 2023/10/7
公告号 CN117333799A
公开日 2024/1/2
IPC主分类号 G06V20/40
权利人 淮阴工学院; 张雅琼; 李怡萱
发明人 金圣华; 张曼; 张雅琼; 李怡萱; 李翔
地址 江苏省淮安市涟水县海安路10号安东大厦8楼; ; 江西省赣州市章贡区红旗大道47号东单元801室

专利主权项内容

1.一种基于可变形锚框的中小学课堂行为检测方法,其特征在于,包括如下步骤:步骤1:获取不同课堂场景下的监控视频,并对视频图像中的学生课堂行为进行半自动标注,构建与课堂场景相关的课堂行为数据集;步骤2:使用YOLOv8骨干网络提取特征,其中有80×80×256、40×40×512、20×20×1024三个尺度的特征图;将特征尺度为80×80×256的特征图作为输入,输入可变形锚框模块CAF,输出可变形锚框的参数,生成偏移量结果;所述可变形锚框模块CAF包括输入适配层、3组可变形卷积层、1个池化层、1个回归分支以及最终输出层;步骤3:使用YOLOv8骨干网络提取特征,将步骤2中得到的特征尺寸为40×40×512的特征图作为输入,输入上下文信息模块CTB,输出语义特征图;所述上下文模块CTB包含通道调整、多尺度上下文、特征融合和注意力机制4个功能模块;步骤4:将步骤3中语义特征图与原始特征图一起作为输入,输入YOLOv8颈部进行特征融合,然后传给检测头生成预测,生成矩形框结果;步骤5:在后处理阶段,对最大尺度预测框应用步骤2的偏移量调整坐标。 来源:百度马 克 数据网