一种面向足球对战的数据驱动强化学习方法

申请号: CN202410217870.8

申请人: 南京信息工程大学; 中科南京人工智能创新研究院

更新日期: 2026-03-17

摘要文本

南京信息工程大学; 中科南京人工智能创新研究院取得“一种透气窗帘布”专利技术，本发明公开了一种面向足球对战的数据驱动强化学习方法，包括：1、在网络平台上采集足球博弈所需的数据；2、对步骤1的数据进行预处理，得到预处理数据；3、构建离线强化学习网络模型；4、基于预处理数据，对离线强化学习网络模型进行训练及测试，得到训练完成的模型；5、基于训练完成的模型，解决谷歌足球环境中各智能体的决策问题。本发明使用离线强化学习的思想解决谷歌足球环境，使用Transformer强大的预测能力来增加算法效果，不仅可以增加训练速度，对比当前的离线强化学习算法在稀疏环境的效果也有不错的提升。

专利主权项内容

1.一种面向足球对战的数据驱动强化学习方法，其特征在于，包括如下步骤：步骤1、在网络平台上采集足球博弈所需的数据集；步骤2、对步骤1的数据进行预处理，得到预处理数据；步骤3、构建离线强化学习网络模型；步骤4、基于预处理数据，对离线强化学习网络模型进行训练及测试，得到训练完成的模型；步骤5、基于训练完成的模型，解决谷歌足球环境中各智能体的决策问题。

专利申请信息

项目	内容
专利名称	一种面向足球对战的数据驱动强化学习方法
专利类型	发明申请
申请号	CN202410217870.8
申请日	2024/2/28
公告号	CN117807894A
公开日	2024/4/2
IPC主分类号	G06F30/27
权利人	南京信息工程大学; 中科南京人工智能创新研究院
发明人	蓝昆; 李军侠; 张希
地址	江苏省南京市江北新区宁六路219号; 江苏省南京市创研路266号麒麟人工智能产业园3号楼3楼

一种面向足球对战的数据驱动强化学习方法

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

一种面向足球对战的数据驱动强化学习方法

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

一种具有过压保护功能的低压沟槽MOSFET及其制作方法

聚电解质络合物插层氧化石墨烯渗透汽化膜及其制备方法和应用

基于频谱分析的入耳检测方法及系统

一种二值条纹的相移编码方法

一种基于跨模态特征注意力交互的全色锐化方法

一种基于ReID和Yolov5双模型下的可视化特定行人追踪方法及系统

热门技术领域

快速入口

专利技术资料