一种卫星遥感大数据集统计方法、装置及设备
摘要文本
本发明公开一种卫星遥感大数据集统计方法、装置及设备,涉及卫星遥感技术领域,用于解决现有技术中对大数据集操作困难,以及选取的小数据集无法正确反映原数据集的特性,稳定性差的问题。包括:分块读取待统计卫星遥感大数据集的数据点对;计算数据点对的平均偏差和标准差,并进行3‑σ数据剔除,得到有效数据点对;计算有效数据点对的偏差,并按照偏差大小进行排序;将有效数据点对根据段内极差最小法进行分段,并根据要抽取的数据总数,对分段后的有效数据点对按比例随机取样;将每一段抽取得到的取样数据进行合并,形成目标数据集,基于目标数据集进行统计计算和绘图。本发明抽取的数据集统计计算结果更接近,多次计算的稳定性更好。
申请人信息
- 申请人:国家卫星海洋应用中心; 中国海洋大学
- 申请人地址:100081 北京市海淀区大慧寺8号
- 发明人: 国家卫星海洋应用中心; 中国海洋大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种卫星遥感大数据集统计方法、装置及设备 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311746145.1 |
| 申请日 | 2023/12/19 |
| 公告号 | CN117421354B |
| 公开日 | 2024/3/19 |
| IPC主分类号 | G06F16/2458 |
| 权利人 | 国家卫星海洋应用中心; 中国海洋大学 |
| 发明人 | 王士帅; 周武; 殷晓斌; 鲍青柳; 李炎 |
| 地址 | 北京市海淀区大慧寺8号; 山东省青岛市崂山区松岭路238号 |
专利主权项内容
1.一种卫星遥感大数据集统计方法,其特征在于,方法包括:分块读取待统计卫星遥感大数据集对应的数据点对;所述数据点对的数量为千万级到百亿级;计算所述数据点对的平均偏差和标准差,并进行3-σ数据剔除,得到有效数据点对;计算所述有效数据点对的偏差,并按照所述偏差大小对所述有效数据点对进行排序;将所述有效数据点对根据段内极差最小法进行分段,并根据要抽取的数据总数,对分段后的所述有效数据点对按比例随机取样,得到取样数据;将每一段抽取得到的取样数据进行合并,形成目标数据集,并基于所述目标数据集进行统计计算和绘图;所述分块读取待统计卫星遥感大数据集对应的数据点对,具体包括:按照待统计卫星遥感大数据集的(1/2)^n进行分块读取;其中,n为分块的次数,n=1, 2, 3, …;所述计算所述有效数据点对的偏差,具体包括:计算所述有效数据点对中的观测值与真实值之间的差值,将所述差值确定为所述有效数据点对的偏差;进行3-σ数据剔除,得到有效数据点对,具体包括:将存进内存的所述数据点对中满足预设剔除条件的数据点对进行剔除,得到有效数据点对;所述预设剔除条件为:Bias<mBias-3*mStd;或者,所述预设剔除条件为:Bias>mBias+3*mStd;其中,Bias表示任意一个数据点对的偏差,mBias表示数据点对的平均偏差,mStd表示数据点对的标准差。