← 返回列表

基于人工智能的无线充电自动控制方法及系统

申请号: CN202410054498.3
申请人: 朗峰新材料启东有限公司
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 基于人工智能的无线充电自动控制方法及系统
专利类型 发明授权
申请号 CN202410054498.3
申请日 2024/1/15
公告号 CN117565727B
公开日 2024/4/2
IPC主分类号 B60L53/60
权利人 朗峰新材料启东有限公司
发明人 江沐风; 江向荣
地址 江苏省南通市启东市少直镇工业园区

摘要文本

本发明公开了一种基于人工智能的无线充电自动控制方法及系统,方法包括设备识别与定位、充电需求预测、充电控制策略、充电安全监测、系统实施与优化。本发明属于无线充电技术领域,具体是指一种基于人工智能的无线充电自动控制方法及系统,本方案采用人工智能网络模型来预测充电需求,有效调度充电桩,在充电需求不同的情况下将车辆的充电效率最大化、充电桩的使用率最大化;通过设定自适应的充电控制策略,使用强化学习根据充电场景和充电需求预测实时调整充电策略,保证了充电过程的稳定性。

专利主权项内容

1.基于人工智能的无线充电自动控制方法,其特征在于:该方法包括以下步骤:步骤S1:设备识别与定位,利用充电桩识别车辆的位置并与车辆建立通信连接,实时获取车辆的充电状态;步骤S2:充电需求预测,收集充电桩的历史充电数据,结合车辆的充电状态,建立递归神经网络模型来预测车辆的充电需求;步骤S3:充电控制策略,根据预测车辆的充电需求和车辆的充电状态,采用强化学习自适应调整算法设计充电控制策略;步骤S4:充电安全监测,监测充电桩状态,建立远程通信,实时监测车辆在充电过程中的安全性;步骤S5:系统实施与优化,将充电控制策略实施到无线充电系统中,并持续监测和优化无线充电系统的性能;在步骤S2中,所述充电需求预测,包括以下步骤:步骤S21:数据采集,采集新能源汽车充电桩使用记录作为公开数据集,所述公开数据集包括充电桩标识符、车辆充电的开始和结束时间、充电量及充电功率;步骤S22:数据预处理,对公开数据集进行预处理,去除重复、缺失和异常的数据,得到预处理后的数据作为样本库;步骤S23:特征工程,从样本库中提取相关特征,转换为时间序列作为模型的输入,步骤如下:步骤S231:将充电桩标识符通过独热编码转换为只含有0和1的向量表示形式;步骤S232:将车辆充电的开始和结束时间转换为以分钟划分的时间点构建成时间序列数据,将充电量和充电功率随时间的变化作为额外的时间序列数据;步骤S233:将充电桩标识符的向量表示形式、时间序列数据和额外的时间序列数据进行组合,形成一个完整的输入序列,每个输入序列表示为[充电桩标识符(t),充电时间(t),充电量(t),充电功率(t)],作为一个时间步的输入;步骤S24:划分数据集,将预处理后的数据随机选取70%作为训练集用于模型训练,30%作为测试集用于模型测试;步骤S25:模型构建,构建LSTM-attention模型,LSTM-attention模型由编码器、注意力机制、解码器构成,步骤如下:步骤S251:编码器,构建LSTM网络作为LSTM-attention模型的编码器,LSTM网络是一种递归神经网络,由连续的记忆细胞组成,每个记忆细胞包含遗忘门、输入门和输出门三个部分,步骤如下:步骤S2511:遗忘门,使用上一个记忆细胞在时间内输出的隐层状态/>和当前记忆细胞在时间/>内输入的序列/>构建遗忘门/>,所用公式如下:
;式中,是sigmoid函数,/>是遗忘门的权重矩阵,/>是遗忘门的偏置向量;步骤S2512:输入门,使用上一个记忆细胞在时间内输出的隐层状态/>和当前记忆细胞在时间/>内输入的序列/>构建输入门/>,所用公式如下:
;式中,是输入门的权重矩阵,/>是输入门的偏置向量;使用函数得到候选细胞信息/>,所用公式如下:
;式中,是加权权重矩阵,/>是加权偏置向量;将输入门和候选细胞信息/>相乘,然后与旧的记忆细胞状态/>相加,得到新的细胞状态/>,所用公式如下:
;式中,和/>分别是时间/>和时间/>的细胞状态;步骤S2513:输出门,使用上一个记忆细胞在时间内输出的隐层状态/>和当前记忆细胞在时间/>内输入的序列/>构建输出门/>,所用公式如下:
;式中,是输出门的权重矩阵,/>是输出门的偏置向量;使用函数激活新的细胞状态/>,然后与输出门/>相乘得到结果/>作为注意力机制的输入,所用公式如下:
;步骤S252:注意力机制,利用不同时间步的输入对预测结果的重要性进行动态调整,步骤如下:步骤S2521:权重计算,将输入向量经过线性变换和激活函数,得到最终的权重向量/>,所用公式如下:
;式中,是权重向量,/>是/>的转置,/>是权重矩阵,/>是偏置向量;步骤S2522:归一化,将权重向量中的元素转化为概率分布,所用公式如下:
;式中,表示权重向量元素的概率表示,/>表示归一化函数;步骤S2523:带权和计算,将输入向量与对应的权重向量元素的概率表示/>相乘,累加结果得到输出/>,所用公式如下:
;步骤S253:解码器,根据注意力机制的输出逐步构造出预测序列;步骤S26:模型训练,使用训练集对模型进行训练,通过多次迭代调整模型参数,步骤如下:步骤S261:初始化模型参数,对LSTM-attention模型的权重矩阵和偏置向量进行初始化;步骤S262:选择损失函数,使用平均绝对误差MAE作为损失函数用于定义模型性能,所用公式如下:
;式中,为真实值,/>为模型预测值,/>为样本数量;步骤S263:选择优化器,选择Adam优化器来最小化损失函数,在每个训练迭代过程中不断调整LSTM-attention模型的权重矩阵和偏置向量以最小化平均绝对误差MAE,所用公式如下:
;式中,是LSTM-attention模型的权重矩阵和偏置向量的集合,/>是学习率,/>是偏差校正的一阶估计,/>是偏差校正的二阶估计,/>是数值稳定性常数;步骤S264:LSTM-attention模型训练,将训练集输入至LSTM-attention模型中,设置LSTM-attention模型的超参数进行训练,重复迭代调整LSTM-attention模型的权重矩阵和偏置向量直到LSTM-attention模型收敛,训练完成后得到LSTM-attention-A模型;步骤S27:模型验证,将测试集输入至LSTM-attention-A模型中,使用平均绝对误差MAE进行验证,根据验证值调整LSTM-attention-A模型的参数和结构;步骤S28:性能评估,用均方根误差计算模型预测值与真实值的匹配程度来评估模型的预测精度,所用公式如下:
;步骤S29:运行,通过LSTM-attention-A模型对充电桩实时数据进行预测车辆的充电需求,根据LSTM-attention-A模型提供的预测结果进行后续充电控制策略的制定;在步骤S3中,所述充电控制策略,包括以下步骤:步骤S31:初始化充电控制策略,构建基于经验回放的Q学习框架,将LSTM-attention-A模型的预测结果作为基于经验回放的Q学习框架的输入特征之一,使用马尔可夫决策过程初始化充电控制策略的参数,所用公式如下:
;式中,表示状态空间,/>表示动作空间,/>表示折扣因子,/>表示状态转移概率,/>表示每个状态-动作对的确定性奖励;步骤S32:初始化数据集,将对充电控制行为做出决策的充电桩设置为智能体,智能体从实时获取的车辆的充电状态中学习经验,并将学习到的经验作为经验样本存储在数据集/>中,所用公式如下:
;式中,表示轮次编号,/>表示时间步,/>表示经验学习轮次的序号,/>表示/>时刻的状态,/>表示/>时刻执行的充电动作,/>表示采取充电动作/>后转移到/>时刻的状态,/>表示采取充电动作/>后获得的即时奖励;步骤S33:Q值函数表示,马尔可夫决策过程的状态空间和动作空间采用近似的Q值函数表示,步骤如下:步骤S331:采用线性函数逼近器近似表示Q值函数,评估在特定状态下采取某个充电动作的价值,所用公式如下:
;式中,是状态-动作对/>的特征向量,/>是在/>时刻学习经验得到的参数向量,表示在/>时刻通过参数向量/>和特征向量/>计算得到的价值估计,/>表示折扣因子作用于未来奖励的累积效果,/>表示/>时刻的即时奖励;步骤S332:构造时刻关于参数向量/>的目标方程,执行充电动作/>后预期获得的累积奖励用Q值表示,通过将预测的Q值与真实Q值之间的均方误差最小化,使得Q值的估计更加接近真实值,所用公式如下:
;式中,为状态-动作对/>在所有状态-动作对中所占的比例,/>表示策略下任意状态-动作对/>的真实值,/>表示时间步/>时任意状态-动作对/>的Q值的估计;步骤S333:在连续的状态空间下,采用梯度下降算法求参数向量,所用公式如下:
;式中,表示学习率,/>表示参数向量/>的转置;步骤S334:Q值函数达到最优后,通过一步映射获得最优策略,所用公式如下:
;步骤S34:动作选择,对于每个时间步,根据步骤S2中LSTM-attention-A模型预测的充电需求,结合ε-greedy策略选取合适的充电动作/>,即智能体以/>的概率来选择动作空间/>中的随机动作,以/>的概率选择Q值最大的贪心动作/>以最大化累积奖励,所用公式如下:
;式中,是探索因子;步骤S35:动作执行,执行当前时间步的充电动作,获得下一个状态/>和即时奖励,计算样本的序号/>,所用公式如下:
;式中,为用于区分不同轮次的常数,/>表示轮次编号,/>是时间步;步骤S36:更新样本数据集,所用公式如下:
;步骤S37:学习参数向量,若当前时间步/>是最大时间步/>的整数倍,则根据在线学习算法对参数向量/>进行更新,步骤如下:步骤S371:采用均匀分布从数据集中读取样本/>;步骤S372:读取数据集中与样本/>具有相同状态/>和充电动作的所有样本,取出使下一个状态/>具有最大Q值的贪心动作/>,所用公式如下:
;步骤S373:生成状态-动作对对应的特征向量/>;步骤S374:更新参数向量,所用公式如下:
;步骤S375:重复执行步骤S371至S374直到次,输出值函数参数向量/>;步骤S38:状态更新,将当前时刻状态更新为;步骤S39:最优策略生成,当参数向量数值不再发生变化时,即值函数/>对于特定的状态-动作对在权重上达到了平衡,值函数收敛到局部最优解,生成无线充电最优控制策略。