← 返回列表

一种基于假设检验的有限样本下数据驱动径流预报模型优选方法

申请号: CN202311000418.8
申请人: 长江勘测规划设计研究有限责任公司
申请日期: 2023/8/9

摘要文本

本发明提供一种基于假设检验的有限样本下数据驱动径流预报模型优选方法,包括:建立径流与预报因子之间的映射关系,选择多个数据驱动模型对映射关系进行描述,建立备选模型集;对选择的模型假设率定模型参数,作为真实模型的总体估计;对总体的模型进行抽样,将样本集划分为训练集和测试集,对每一组划分方案进行模型率定和检验,得到预测精度的抽样分布;确定最佳样本集划分容量;计算测试集的预测精度以及统计量的观察值;根据统计量的观察值是否落在拒绝域,判断是否拒绝原假设;若存在多个备选模型均通过假设检验,基于“拒绝率最小”准则进行模型优选。本发明可验证预报模型对未知总体推断预测的可靠性,为预报模型的优选提供决策依据。

专利详细信息

项目 内容
专利名称 一种基于假设检验的有限样本下数据驱动径流预报模型优选方法
专利类型 发明申请
申请号 CN202311000418.8
申请日 2023/8/9
公告号 CN117494862A
公开日 2024/2/2
IPC主分类号 G06Q10/04
权利人 长江勘测规划设计研究有限责任公司
发明人 丁小玲; 胡维忠; 陈尚法; 罗斌; 苏培芳; 唐海华; 周超; 蔡林杰; 周廷璋
地址 湖北省武汉市汉口解放大道1863号

专利主权项内容

1.一种基于假设检验的有限样本下数据驱动径流预报模型优选方法,其特征在于,包括如下步骤:步骤1:根据历史径流资料和气象数据筛选预报因子,建立径流与预报因子之间的映射关系,选择多个数据驱动模型对所述映射关系进行描述,建立备选模型集;步骤2:根据步骤1中的备选模型集,选择一个模型作为模型假设,定义原假设H和备择假设H用于检验预报模型的真实性;其中:01H:模型y=f(X;ω)+ε,ε~g(θ)假设为真,采用训练集率定得到的预报模型为真实模型,其在测试集D=(X,y)的预测精度σ(n,m)等于模型真实精度σ;0**L,mmm*H1:预报模型不为真,即预测精度σ(n,m)不等于σ;*若预报模型为真,则σ(n,m)在一定的许可偏差范围内逼近σ,构造统计量:*Z=σ(n,m)-σ (2)*当σ(n,m)使得统计量Z的观察值z的绝对值|z|过分大的情况发生时,拒绝假设H,反之接受假设H;000步骤3:对步骤2中选择的一个模型假设,采用样本容量为L的实测样本率定模型参数,作为真实模型的总体估计,总体的模型记为y=f(X;ω)+ε,ε~g(θ),模型真实精度估计为σ;***步骤4:采用蒙特卡洛法对总体的模型y=f(X;ω)+ε,ε~g(θ)进行样本容量为L的抽样,记抽样次数为C,C次样本容量均为L,一次抽样记为样本集D,对于每一个抽样,将样本集D划分为样本容量分别为n和m的训练集D=(X,y)和测试集D=(X,y),记该样本集划分方案为L(n,m),将训练集D用于模型参数率定,测试集D用于模型预测精度的检验;对每一组划分方案L(n,m)方案,采用C次抽样进行模型率定和检验,得到预测精度的抽样分布;**LLL,nnnL,mmmL,nL,m步骤5:以平均距离最小为原则确定最佳样本集划分容量L(nr,mr),使得统计量Z的抽样分布尽可能逼近真实H,若Z的抽样分布与模型真实精度的平均距离指标越小,代表统计量Z的抽样分布足够逼近真实H,即最佳样本集划分容量L(nr,mr)的预测精度σ(n,m)的抽样分布与模型真实精度σ逼近,原假设H为真的概率越大;00*0步骤6:根据步骤5中最佳样本集划分容量L(nr,mr)的预测精度σ(n,m)样本集构建统计量Z的抽样分布,根据统计量Z的抽样分布和给定显著性水平α确定统计量Z抽样分布的拒绝域;步骤7:基于实测样本构建样本划分容量为L(n,m)的预报模型,计算测试集的预测精度/>以及统计量Z的观察值z;rr0步骤8:根据统计量Z的观察值z是否落在统计量Z抽样分布的拒绝域,判断是否拒绝原假设H,若拒绝原假设H,则当前模型未通过假设检验,不适合作为优选模型;若存在多个备选模型均通过假设检验,进一步采用p值法给出原假设H可被拒绝的最小显著性水平,p值的计算式为:0000p=P{|z|≥z}0认为对原假设H拒绝率1-p最小的模型最接近真实模型,基于“拒绝率最小”准则进行模型优选。0