一种基于策略因子和过载消解的硬实时准入控制方法
摘要文本
本发明涉及一种基于策略因子和过载消解的硬实时准入控制方法,属于计算机数据库系统和深度强化学习决策技术领域。本方法结合了深度强化学习模型DQN实现硬实时事务的准入控制,使用GRU模型实现硬实时事务的闭环反馈控制,并通过价值成本执行过载消解机制。本方法特别关注数据库中硬实时事务在时间窗口内产生可预测的判断,以确保事务能够高准确率地在规定的时间限制内完成。本方法提高了硬实时事务执行的准确率,使其更好地适应复杂的任务环境和时间要求。
申请人信息
- 申请人:北京理工大学
- 申请人地址:100081 北京市海淀区中关村南大街5号
- 发明人: 北京理工大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于策略因子和过载消解的硬实时准入控制方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410081476.6 |
| 申请日 | 2024/1/19 |
| 公告号 | CN117591250A |
| 公开日 | 2024/2/23 |
| IPC主分类号 | G06F9/46 |
| 权利人 | 北京理工大学 |
| 发明人 | 张睿恒; 曹哲; 王宏安; 刘雨蒙; 赵怡婧 |
| 地址 | 北京市海淀区中关村南大街5号 |
专利主权项内容
1.一种基于策略因子和过载消解的硬实时准入控制方法,其特征在于,包括以下步骤:步骤1:设计准入策略;首先,定义事务各个层次的输入输出及状态变量,包括任务的执行时间、任务的优先级、任务的最大响应时间、任务资源需求;定义动作空间,对所给事务有明确的动作标签;包括:接受、拒绝或推迟,同时定义触发各动作的条件;设计奖罚机制,对满足条件的任务操作进行奖励,对未能满足设定条件的任务操作进行惩罚,以此提供强化学习控制的基础;然后,构建深度强化学习模型,根据奖惩机制设计事务奖励函数;最后,决策过程优化,根据上述模型与目标函数进行决策过程的优化,进而实现基于深度强化学习的准入策略控制;步骤2:闭环反馈;首先,获取准入控制动作决策,调整步骤1中得到的准入策略,并和当前环境状态一同作为反馈机制的输入;然后,对输入的影响因素进行量化,实现数据特征升维;最后,利用闭环反馈模型的输出进行反馈控制调整;步骤3:基于价值驱动的过载消解;首先,定义硬实时事务的收益函数,综合考虑实时事务的收益与紧急程度;定义系统资源利用率函数,定量不同系统资源对总体资源的利用程度;定义过载消解函数,衡量硬实时事务的收益和系统资源利用率之间的关系;然后,执行过载消解决策,当系统资源利用率达到设定阈值时,通过执行过载消解函数来评估每个已接纳的硬实时事务的成本。。