← 返回列表

基于深度强化学习人机共驾转向权重系数预测分配方法

申请号: CN202410024719.2
申请人: 南京航空航天大学
申请日期: 2024/1/8

摘要文本

本发明公开了基于深度强化学习人机共驾转向权重系数预测分配方法,具体涉及智能驾驶技术领域,通过规划模块与LSTM神经网络预测未来秒内规划转向数据与驾驶员转向数据,再通过DDPG深度强化学习得到最优分配系数,最优转向模块结合前三者输出得到未来秒内最优转向动作,由风险评估模块最优转向动作进行实时风险评估,动作决策模块决策得到最终动作,输入给人机共驾车辆,通过对未来的预测,实现深度强化学习网络的预学习。本发明能提前预测未来秒内最优转向动作,并实时进行风险评估,进而对人机共驾车辆实现实时控制,节省车载计算机计算资源,安全高效控制智能车辆。

专利详细信息

项目 内容
专利名称 基于深度强化学习人机共驾转向权重系数预测分配方法
专利类型 发明申请
申请号 CN202410024719.2
申请日 2024/1/8
公告号 CN117829256A
公开日 2024/4/5
IPC主分类号 G06N3/092
权利人 南京航空航天大学
发明人 陈翔; 李雨书; 丁文龙; 赵万忠; 王春燕
地址 江苏省南京市秦淮区御道街29号

专利主权项内容

1.基于深度强化学习人机共驾转向权重系数预测分配方法,利用识别设备获取路况信息及驾驶员信息, 其特征在于:预测分配方法包括以下步骤:S1:根据路况信息,利用五次多项式,通过规划模块得到未来t秒内的时序性规划转向预测数据;S2:建立LSTM深度神经网络,通过大数据对神经网络进行训练,再根据驾驶员信息,得到未来t秒内时序性驾驶员转向预测数据;S3:建立DDPG深度强化学习网络,设置DDPG智能体初始策略,得到未来t秒内时序性转向权重系数预测数据,将其输入至人机共驾权重分配模块得到未来t秒内时序性转向数据,并将其输入至仿真模块,通过预设奖励评估函数进行评估,更新DDPG智能体初始策略,最终得到最优转向权重分配系数未来t时间段内的时序性数据作为最优策略;S4:结合S1、S2、S3的输出数据,通过最优转向模块,得到未来t秒内每个时刻的最优转向动作;风险评估模块结合当前路况信息计算得到最优转向动作风险值;S5:动作决策模块根据风险评估模块得到的风险评估值进行决策,若风险值符合预设安全条件,动作决策模块则将最优转向动作输入至人机共驾车辆;若不符合预设安全条件,动作决策模块则将执行预设制动动作,保证车辆安全性。