← 返回列表

一种面向足球对战的数据驱动强化学习方法

申请号: CN202410217870.8
申请人: 南京信息工程大学; 中科南京人工智能创新研究院
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种面向足球对战的数据驱动强化学习方法
专利类型 发明申请
申请号 CN202410217870.8
申请日 2024/2/28
公告号 CN117807894A
公开日 2024/4/2
IPC主分类号 G06F30/27
权利人 南京信息工程大学; 中科南京人工智能创新研究院
发明人 蓝昆; 李军侠; 张希
地址 江苏省南京市江北新区宁六路219号; 江苏省南京市创研路266号麒麟人工智能产业园3号楼3楼

摘要文本

本发明公开了一种面向足球对战的数据驱动强化学习方法,包括:1、在网络平台上采集足球博弈所需的数据;2、对步骤1的数据进行预处理,得到预处理数据;3、构建离线强化学习网络模型;4、基于预处理数据,对离线强化学习网络模型进行训练及测试,得到训练完成的模型;5、基于训练完成的模型,解决谷歌足球环境中各智能体的决策问题。本发明使用离线强化学习的思想解决谷歌足球环境,使用Transformer强大的预测能力来增加算法效果,不仅可以增加训练速度,对比当前的离线强化学习算法在稀疏环境的效果也有不错的提升。

专利主权项内容

1.一种面向足球对战的数据驱动强化学习方法,其特征在于,包括如下步骤:步骤1、在网络平台上采集足球博弈所需的数据集;步骤2、对步骤1的数据进行预处理,得到预处理数据;步骤3、构建离线强化学习网络模型;步骤4、基于预处理数据,对离线强化学习网络模型进行训练及测试,得到训练完成的模型;步骤5、基于训练完成的模型,解决谷歌足球环境中各智能体的决策问题。