用于乘车订单调度的系统和方法
摘要文本
本发明提供了用于乘车订单调度的系统和方法。所述方法可以包括获取关于车辆的位置的信息和输入到训练后的第二神经网络算法中的时间;以及基于从训练后的第二神经网络算法产生的策略,获取车辆的动作信息,所述动作信息包括:停留在车辆的当前位置、重新定位车辆或接受乘车订单。
申请人信息
- 申请人:北京嘀嘀无限科技发展有限公司
- 申请人地址:100193 北京市海淀区东北旺路西路8号院34号楼
- 发明人: 北京嘀嘀无限科技发展有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 用于乘车订单调度的系统和方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN201880001535.7 |
| 申请日 | 2018年6月5日 |
| 公告号 | CN111033535B |
| 公开日 | 2024年3月26日 |
| IPC主分类号 | G06Q10/04 |
| 权利人 | 北京嘀嘀无限科技发展有限公司 |
| 发明人 | 秦志伟; 唐小程; 王照栋; 叶杰平 |
| 地址 | 北京市海淀区东北旺路西路8号院34号楼 |
专利主权项内容
1.一种用于乘车订单调度的方法,包括:获取关于车辆的位置信息和时间信息以输入到训练后的第二神经网络算法中;以及基于从训练后的第二神经网络算法产生的策略,获取车辆的动作信息,所述动作信息包括:停留在车辆的当前位置,重新定位车辆或接受乘车订单,其中,所述第二神经网络算法由一个或多个第一网络权重以及与第二区域相关联的第二乘车订单调度数据训练,以获取一个或多个第二网络权重;所述一个或多个第一网络权重通过在第一训练中利用与第一区域相关联的第一乘车订单调度数据训练第一神经网络算法获取;其中,所述第一网络权重被更新以获得第一策略,所述第一策略最大化关于所述第一区域的累积奖励,所述第二网络权重被更新以获得第二策略,所述第二策略最大化关于所述第二区域的所述累积奖励;所述第二神经网络算法包括输入层、第一隐藏层序列、第二隐藏层序列和输出层;所述第一隐藏层序列中的每个隐藏层具有相应地耦合到所述第二隐藏层序列中的一个所述隐藏层和所述输出层的输出;以及对于所述输入层,所述第二乘车订单调度数据包括(1)用于输入到所述第二隐藏层序列中的一个或多个第二状态输入和(2)用于输入到所述第一隐藏层序列中的一个或多个第一状态输入,第一状态与起点对应,第二状态与目的地对应;其中,所述第二状态输入包括时空矢量,所述时空矢量包括历史地理坐标和相关联的时间戳;以及所述第一状态输入包括时空位移矢量以及一个或多个实时上下文特征;所述时空位移矢量包括模拟车辆的地理坐标变化和时间变化,所述实时上下文特征包括以下至少一个:实时数量的闲置驾驶员的实时数量;或在一个过去时间段内创建的实时订单数量;所述第二神经网络算法的训练方式包括:将深度神经网络和强化学习算法结合,执行扩展动作搜索,并且对于每个动作的动作值的多个输出,输出的最大值用于更新所述第二神经网络算法,获得所述训练后的所述第二神经网络算法。