← 返回列表

基于二分缩减的实时目标检测方法及系统

申请号: CN202410150166.5
申请人: 中科方寸知微(南京)科技有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 基于二分缩减的实时目标检测方法及系统
专利类型 发明申请
申请号 CN202410150166.5
申请日 2024/2/2
公告号 CN117671801A
公开日 2024/3/8
IPC主分类号 G06V40/20
权利人 中科方寸知微(南京)科技有限公司
发明人 冷聪
地址 江苏省南京市江宁区麒麟科技创新园创研路266号人工智能产业园3号楼203B室

摘要文本

本发明提出了一种基于二分缩减的实时目标检测方法及系统,包括:构建两个不同的目标检测模型;输入一个视频以及一个刷新频率;处理视频的第一帧,得到人体检测框;处理视频的后续帧,用二值图来表示当前帧的潜在目标区域;对潜在目标区域进行显著性区域提取;对运动区域框进行重排列;对重排列后的图像进行目标检测,输出当前帧的检测结果;逐一对比重排列后的图像的检测结果和重排列前的图像的运动区域框,计算出当前帧的检测结果在原始图像中的位置和大小;直到视频检测结束。本发明方案能够解决目标检测模型对实际应用场景中小目标物体效果不佳,容易漏检的问题。

专利主权项内容

1.一种基于二分缩减的实时目标检测方法,其特征是,包括:S1,构建至少两个用于在视频中检测出人体位置和大小的目标检测模型,并初始化系统;目标检测模型包括第一目标检测模型和第二目标检测模型,其中第一目标检测模型的精度高于第二目标模型,计算速度低于第二目标检测模型;S2,采集并构建视频数据集合,获取至少一个视频以及至少一个刷新频率作为输入;S3,获取视频的第一帧图像,采用第一目标检测模型进行目标检测,得到人体检测框;S4,针对视频中第二帧起的后续各帧,采用多目标跟踪及动态区域检测算法进行检测,并使用二值图来表示当前帧的潜在目标区域R;tmoveS5,针对每一潜在目标区域R,采用二值图像膨胀算法,确定图像的运动区域框R,以提取潜在目标区域中的显著性区域:tmovetbboxS6,采用二分缩减的矩形框重排列算法对运动区域框R进行重排,获得重排列后图像I,以及运动区域框R在图像I中的位置R;tbboxtnewtbboxtnewtnewS7,采用第二目标检测模型对重排列后的图像I进行目标检测,输出当前帧的检测结果R,检测结果R包括每个目标的位置和大小;tnewtdettdetS8,逐一对比重排列后的图像的检测结果R和重排列前图像的运动区域框R的矩形框,构建矩形框的对应关系,对应计算出当前帧的检测结果在原始图像中的位置和大小,即R;t为自然数;tdettbboxtfinalS9,重复步骤S4至S8,直至完成检测工作。