← 返回列表
一种决策模型的训练方法、小程序巡检方法及装置
摘要文本
本说明书一个或多个实施例公开了一种决策模型的训练方法,包括:获取用户的意图标签,以及用户基于所述意图标签所描述的意图与网页进行交互的交互动作序列;获取用户在执行所述交互动作序列的过程中所交互的网页图像样本;将所述网页图像样本和所述意图标签输入生成模型,得到决策结果;基于所述决策结果和决策标签确定损失函数,来更新所述生成模型的参数,以得到目标决策模型。该方法提供的决策模型能够针对不同的小程序进行自动化决策,以快速生成巡检路径。相应地,本说明书还公开了决策模型的训练装置、小程序巡检方法及装置。
申请人信息
- 申请人:支付宝(杭州)信息技术有限公司
- 申请人地址:310063 浙江省杭州市西湖区西溪路556号8层B段801-11
- 发明人: 支付宝(杭州)信息技术有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种决策模型的训练方法、小程序巡检方法及装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410177223.9 |
| 申请日 | 2024/2/8 |
| 公告号 | CN117725975A |
| 公开日 | 2024/3/19 |
| IPC主分类号 | G06N3/08 |
| 权利人 | 支付宝(杭州)信息技术有限公司 |
| 发明人 | 王可; 孟昌华 |
| 地址 | 浙江省杭州市西湖区西溪路556号8层B段801-11 |
专利主权项内容
1.一种决策模型的训练方法,包括:获取用户的意图标签,以及用户基于所述意图标签所描述的意图与网页进行交互的交互动作序列;获取用户在执行所述交互动作序列的过程中所交互的网页图像样本;将所述网页图像样本和所述意图标签输入生成模型,得到决策结果;基于所述决策结果和决策标签确定损失函数,来更新所述生成模型的参数,以得到目标决策模型;所述决策标签是根据所述交互动作序列中的每一个交互动作及该交互动作在所述网页图像样本中的操作对象来确定的。 数据由马 克 团 队整理