基于深度强化学习人机共驾转向权重系数预测分配方法

申请号: CN202410024719.2

申请人: 南京航空航天大学

申请日期: 2024/1/8

摘要文本

本发明公开了基于深度强化学习人机共驾转向权重系数预测分配方法，具体涉及智能驾驶技术领域，通过规划模块与LSTM神经网络预测未来秒内规划转向数据与驾驶员转向数据，再通过DDPG深度强化学习得到最优分配系数，最优转向模块结合前三者输出得到未来秒内最优转向动作，由风险评估模块最优转向动作进行实时风险评估，动作决策模块决策得到最终动作，输入给人机共驾车辆，通过对未来的预测，实现深度强化学习网络的预学习。本发明能提前预测未来秒内最优转向动作，并实时进行风险评估，进而对人机共驾车辆实现实时控制，节省车载计算机计算资源，安全高效控制智能车辆。

申请人信息

申请人:南京航空航天大学
申请人地址:210016 江苏省南京市秦淮区御道街29号
发明人: 南京航空航天大学

专利详细信息

项目	内容
专利名称	基于深度强化学习人机共驾转向权重系数预测分配方法
专利类型	发明申请
申请号	CN202410024719.2
申请日	2024/1/8
公告号	CN117829256A
公开日	2024/4/5
IPC主分类号	G06N3/092
权利人	南京航空航天大学
发明人	陈翔; 李雨书; 丁文龙; 赵万忠; 王春燕
地址	江苏省南京市秦淮区御道街29号

专利主权项内容

1.基于深度强化学习人机共驾转向权重系数预测分配方法，利用识别设备获取路况信息及驾驶员信息, 其特征在于：预测分配方法包括以下步骤：S1：根据路况信息，利用五次多项式，通过规划模块得到未来t秒内的时序性规划转向预测数据；S2：建立LSTM深度神经网络，通过大数据对神经网络进行训练，再根据驾驶员信息，得到未来t秒内时序性驾驶员转向预测数据；S3：建立DDPG深度强化学习网络，设置DDPG智能体初始策略，得到未来t秒内时序性转向权重系数预测数据，将其输入至人机共驾权重分配模块得到未来t秒内时序性转向数据，并将其输入至仿真模块，通过预设奖励评估函数进行评估，更新DDPG智能体初始策略，最终得到最优转向权重分配系数未来t时间段内的时序性数据作为最优策略；S4：结合S1、S2、S3的输出数据，通过最优转向模块，得到未来t秒内每个时刻的最优转向动作；风险评估模块结合当前路况信息计算得到最优转向动作风险值；S5：动作决策模块根据风险评估模块得到的风险评估值进行决策，若风险值符合预设安全条件，动作决策模块则将最优转向动作输入至人机共驾车辆；若不符合预设安全条件，动作决策模块则将执行预设制动动作，保证车辆安全性。

基于深度强化学习人机共驾转向权重系数预测分配方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

基于深度强化学习人机共驾转向权重系数预测分配方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种用于分布式光伏方法发电的优化配置方法及系统

一种靶向热休克蛋白90的特异性肿瘤诊断探针和显像剂

企业数字化运营多维数据分析方法及系统

用于感知网络中边缘节点健康状态的方法、设备和介质

一种音频信息内容识别方法

一种输水隧洞水下检测机器人及使用方法

热门技术领域

快速入口

专利技术资料

特别鸣谢