一种用于企业融资额度估算的商业汇票大数据分析方法
摘要文本
本发明涉及信息管理技术领域,尤其涉及一种用于企业融资额度估算的商业汇票大数据分析方法。本发明方法,根据企业历史汇票交易数据,通过离群值逐步收敛法寻找模型效果最优点,使模型效果影响比较大的离群值逐步收敛,降低离群值对模型训练的噪声干扰,使模型更加稳定;本发明方法,基于解释变量与响应变量数据进行多元线性回归算法建模,利用最小二乘参数估计法求解,使之与响应变量之间的相关关系的方差扰动降低,应用方差膨胀因子减少多重共线性影响,使模型泛化能力更加稳健;本发明方法,应用企业实际授信额度与预测额度之间的差值评估算法结果授信额度的可信性,能够精准预测企业贷款授信额度。
申请人信息
- 申请人:深度(山东)数字科技集团有限公司
- 申请人地址:276000 山东省临沂市兰山区柳青街道颐高上海街三期E栋
- 发明人: 深度(山东)数字科技集团有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种用于企业融资额度估算的商业汇票大数据分析方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410021747.9 |
| 申请日 | 2024/1/8 |
| 公告号 | CN117808576A |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06Q40/03 |
| 权利人 | 深度(山东)数字科技集团有限公司 |
| 发明人 | 全传晓; 周力; 夏敏; 王红平; 李大岩 |
| 地址 | 山东省临沂市兰山区柳青街道颐高上海街三期E栋 |
专利主权项内容
1.一种用于企业融资额度估算的商业汇票大数据分析方法,将企业授信金额定义为响应变量,将企业特征指标定义为模型解释变量,方法模型主要采用解释变量对响应变量进行学习,得到能够针对样本外的企业解释变量去预测响应变量值,包括:S1解释变量离群值处理,应用离群值优化算法,通过离群值逐步收敛法寻找模型效果最优点从而达到降低离群值对模型训练的噪声干扰,所述/>为解释变量与响应变量之间的训练模型计算值;模型效果决定系数/>是对线性模型评估的一种评价指标,其值最大为1,最小为0;当值越接近于1,则说明模型越好,此时参数为最优值;值越接近于0,则模型越差;公式:
;其中,表示模型估计值,/>表示样本原始值,/>表示样本原始值的均值;S2解释变量离散化处理,利用最小二乘离散化方法对解释变量进行预处理,使之与响应变量之间的相关关系的方差扰动降低,从而使模型泛化能力更加稳健;最小二乘离散化方法公式:
;
;
;上述公式表达为选取待切分离散化的第j个X变量,遍历其切分点s,使得数据集D划分为和/>,/>和/>分别为数据集/>和/>中Y对应的均值,寻找使得上述表达式值最小的切分点s;S3算法训练构建模型,基于上述两类分析方法处理的解释变量与响应变量数据进行多元线性回归算法建模,利用最小二乘参数估计法求解,并用方差膨胀因子VIF进行多重共线性检验;S3.1采用多元线性回归算法,公式:
;S3.2参数估计方法损失函数:
;其中,i表示第i个样本,n为样本总数,表示因变量模型估计值,/>表示因变量样本原始值,由链式法则对/>中的/>求偏导数,得到:
;上述公式k表示第k个解释变量或参数,两边同时乘以,令d=/>,经过矩阵式转换,得到:
;
;由于参数最优化求解的需要,且L为非凸函数,当时损失函数L值可达到最小,该方法称为最小二乘参数求解法,在等式两边从左侧同时乘以/>,得到:
;S3.3应用方差膨胀因子VIF对回归变量间共线性检验,公式:
;其原理是把第i个解释变量作为响应变量,将其余N-1个变量作为解释变量,作线性回归计算模型得出判决统计量方差膨胀因子VIF,所述/>为第i个解释变量与其他解释变量之间的;方差膨胀因子越大,说明/>越接近1,则第i个解释变量与其他解释变量之间共线程度越强;如果方差膨胀因子VIF大于/>,则认为该变更与剩余N-1个变量之间具备多重共线性,因而剔除该变量;所述/>的取值范围3~10;S4对模型算法进行效果统计与评估,评分模型效果误差统计与分布:
;
为企业实际授信额度与预测额度之间的差值,当误差/>表现出为均值为0的渐近正态分布时,模型效果最佳。