← 返回列表

一种基于多场景识别与语音交互的视频监控方法及系统

申请号: CN202311782545.8
申请人: 深圳市智安天下科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于多场景识别与语音交互的视频监控方法及系统
专利类型 发明申请
申请号 CN202311782545.8
申请日 2023/12/22
公告号 CN117749995A
公开日 2024/3/22
IPC主分类号 H04N7/18
权利人 深圳市智安天下科技有限公司
发明人 李松香; 方权杰
地址 广东省深圳市龙岗区坂田街道马安堂社区布龙路335号龙景科技园E栋201-3

摘要文本

深圳市智安天下科技有限公司取得“一种透气窗帘布”专利技术,本发明公开了一种基于多场景识别与语音交互的视频监控方法及系统,用于视频监控领域,该方法包括以下步骤:在不同场景中获取摄像头采集的视频监控数据;使用深度学习算法分析视频监控数据,识别并分类不同的场景类型;针对每个识别的场景,分别采用不同的目标检测算法识别视频中的物体,并为每个识别的物体构建行为分析模型;基于行为分析模型、预设规则和历史行为数据,识别异常行为;接收并解析通过语音查询的监控信息或报警请求;收集异常行为信息和语音指令的反馈。本发明利用历史行为数据,预设规则和行为分析模型的信息,提供了综合和全面的方式来识别异常行为,提高异常检测的准确性,减少误报和漏报的可能性。 来自:

专利主权项内容

1.一种基于多场景识别与语音交互的视频监控方法,其特征在于,该视频监控方法包括以下步骤:S1、在不同场景中获取摄像头采集的视频监控数据,并对视频监控数据进行预处理;S2、使用深度学习算法分析预处理后的视频监控数据,识别并分类不同的场景类型;S3、针对每个识别的场景,分别采用不同的目标检测算法识别视频中的物体,并为每个识别的物体构建行为分析模型;S4、基于行为分析模型、预设规则和历史行为数据,使用AI技术识别异常行为,并记录异常行为信息;S5、将记录的异常行为信息转化为文本,利用TTS技术将文本信息转化为语音进行通知,接收并解析通过语音查询的监控信息或报警请求;S6、收集异常行为信息和语音指令的反馈,评估并优化行为分析模型。