数据处理方法和装置、存储介质及电子设备
申请人信息
- 申请人:腾讯科技(深圳)有限公司
- 申请人地址:518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 发明人: 腾讯科技(深圳)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 数据处理方法和装置、存储介质及电子设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311689969.X |
| 申请日 | 2023/12/11 |
| 公告号 | CN117390455B |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06F18/214 |
| 权利人 | 腾讯科技(深圳)有限公司 |
| 发明人 | 熊涛; 白旭东; 张婧婧 |
| 地址 | 广东省深圳市南山区高新区科技中一路腾讯大厦35层 |
摘要文本
腾讯科技(深圳)有限公司取得“一种透气窗帘布”专利技术,本申请公开了一种数据处理方法和装置、存储介质及电子设备。其中,该方法包括:获取初始样本数量、初始采样数量和设备数量,然后根据这些参数确定目标样本数量和目标采样数量。接着,在目标分布式设备上进行多批次采样,每次采样根据目标分布式设备的采样能力划分样本数量,并随机采样得到每个批次的采样数量。最后,将各个批次的采样结果合并得到目标分布式采样结果,并将一组分布式设备的目标分布式采样结果合并,得到最终的目标采样结果。本申请解决了由于抽样结果的样本个数不够准确,导致抽样数据的处理效率较低的技术问题。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。
专利主权项内容
1.一种数据处理方法,其特征在于,包括:获取待处理的初始样本数量、需要抽取的初始采样数量和预先确定执行抽样的一组分布式设备的设备数量;根据所述初始样本数量、所述初始采样数量和所述设备数量确定为目标分布式设备分配的目标样本数量和目标采样数量,其中,所述目标样本数量表示所述目标分布式设备上待参与采样的样本数量,所述目标采样数量表示所述目标分布式设备上需要采样出的采样数量;根据所述目标样本数量、所述目标采样数量在所述目标分布式设备上进行多批次采样,确定目标分布式采样结果,其中,所述多批次采样包括从所述目标样本数量开始,依据所述目标分布式设备的采样能力逐批次划分出每个批次待参与采样的样本数量,并从所述目标采样数量开始逐批次随机采样得到每个批次需要采样出的采样数量,对所述每个批次待参与采样的样本数量按照所述每个批次需要采样出的采样数量进行采样,得到各个批次对应的采样结果,将各个批次对应的采样结果合并得到所述目标分布式采样结果;将所述一组分布式设备对应的一组所述目标分布式采样结果进行合并,确定目标采样结果,其中,所述目标采样结果表示对所述初始样本数量按照所述初始采样数量采样的采样结果;所述根据所述目标样本数量、所述目标采样数量在所述目标分布式设备上进行多批次采样,确定目标分布式采样结果,包括:在所述多批次采样包括j批次采样的情况下,将第a-1批次剩余样本数量划分为第a批次样本数量和第a批次剩余样本数量,其中,a为大于或等于2的正整数,a=2时,所述第a-1批次剩余样本数量为所述目标样本数量,所述第a-1批次剩余采样数量为所述目标采样数量,j为大于或等于a的正整数;利用随机数从第a-1批次剩余采样数量中采样出第a批次采样数量和第a批次剩余采样数量;从第a批次样本数量中按照第a批次采样数量进行采样,得到第a批次采样结果;在第j-1批次剩余样本数量满足第一预设条件或第j批次剩余采样数量满足第二预设条件的情况下,根据j批次采样结果确定所述目标分布式采样结果。。微信公众号马克 数据网