← 返回列表
数据处理方法和装置、用于数据处理的装置
摘要文本
本发明实施例提供了一种数据处理方法和装置、用于数据处理的装置,其中的方法具体包括:确定待检测页面的页面内容;依据所述页面内容,对所述待检测页面进行检测,以得到第一检测结果页面;依据所述第一检测结果页面的属性信息,对所述第一检测结果页面进行过滤,以得到第二检测结果页面。本发明实施例可以检测出被新增的恶意推广内容,可以降低复核的工作量,节省人力成本,且可以提高复核的效率。 来自马-克-数-据-官网
申请人信息
- 申请人:北京搜狗科技发展有限公司
- 申请人地址:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
- 发明人: 北京搜狗科技发展有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 数据处理方法和装置、用于数据处理的装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810394877.1 |
| 申请日 | 2018年4月27日 |
| 公告号 | CN110413866B |
| 公开日 | 2024年2月2日 |
| IPC主分类号 | G06F16/9535 |
| 权利人 | 北京搜狗科技发展有限公司 |
| 发明人 | 何筱妍 |
| 地址 | 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |
专利主权项内容
1.一种数据处理方法,其特征在于,所述方法包括:确定待检测页面的页面内容;依据所述页面内容,对所述待检测页面进行检测,以得到第一检测结果页面;依据所述第一检测结果页面的属性信息,对所述第一检测结果页面进行滤重,以得到第二检测结果页面;所述依据所述页面内容,对所述待检测页面进行检测,包括:对所述页面内容与关键词集合中关键词进行匹配;若所述页面内容中存在与所述关键词相匹配的内容,则将所述待检测页面作为所述第一检测结果页面;所述对所述第一检测结果页面进行滤重,包括:依据基于所述属性信息得到的第一过滤特征,对所述第一检测结果页面进行第一过滤,以得到第一过滤结果;依据基于所述属性信息得到的第二过滤特征,对所述第一过滤结果进行第二过滤,以得到第二检测结果页面;其中,所述第一过滤特征包括:页面地址和客户标识,所述第二过滤特征包括:客户标识和匹配关键词;或者所述第一过滤特征包括:客户标识和匹配关键词,所述第二过滤特征包括:页面地址和客户标识;根据所述第二检测结果页面对所述第一检测结果页面进行复核。