← 返回列表
一种面向足球对战的数据驱动强化学习方法
申请人信息
- 申请人:南京信息工程大学; 中科南京人工智能创新研究院
- 申请人地址:210032 江苏省南京市江北新区宁六路219号
- 发明人: 南京信息工程大学; 中科南京人工智能创新研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种面向足球对战的数据驱动强化学习方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410217870.8 |
| 申请日 | 2024/2/28 |
| 公告号 | CN117807894A |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06F30/27 |
| 权利人 | 南京信息工程大学; 中科南京人工智能创新研究院 |
| 发明人 | 蓝昆; 李军侠; 张希 |
| 地址 | 江苏省南京市江北新区宁六路219号; 江苏省南京市创研路266号麒麟人工智能产业园3号楼3楼 |
摘要文本
本发明公开了一种面向足球对战的数据驱动强化学习方法,包括:1、在网络平台上采集足球博弈所需的数据;2、对步骤1的数据进行预处理,得到预处理数据;3、构建离线强化学习网络模型;4、基于预处理数据,对离线强化学习网络模型进行训练及测试,得到训练完成的模型;5、基于训练完成的模型,解决谷歌足球环境中各智能体的决策问题。本发明使用离线强化学习的思想解决谷歌足球环境,使用Transformer强大的预测能力来增加算法效果,不仅可以增加训练速度,对比当前的离线强化学习算法在稀疏环境的效果也有不错的提升。
专利主权项内容
1.一种面向足球对战的数据驱动强化学习方法,其特征在于,包括如下步骤:步骤1、在网络平台上采集足球博弈所需的数据集;步骤2、对步骤1的数据进行预处理,得到预处理数据;步骤3、构建离线强化学习网络模型;步骤4、基于预处理数据,对离线强化学习网络模型进行训练及测试,得到训练完成的模型;步骤5、基于训练完成的模型,解决谷歌足球环境中各智能体的决策问题。