← 返回列表
一种提升模型训练速度的方法、系统、设备及存储介质
摘要文本
本申请公开一种提升模型训练速度的方法、系统、设备及存储介质,应用于模型训练领域,通过获取指定时间范围内的所有样本文件路径,按时间先后顺序,依次执行如下操作:获取目标时间的样本文件路径内的样本,使用分布式系统和映射表,将样本内的样本特征映射为特征行号,并保存到目标时间的行号文件路径的行号文件里;获取指定时间范围内的所有行号文件路径,按时间先后顺序,依次执行如下操作:获取目标时间的行号文件路径内的特征行号,使用特征行号获取特征参数进行模型训练,独立运行根据特征获取特征行号,以及根据特征行号获取特征参数两个环节,并对第一个环节使用分布式系统加速,从而提升模型训练速度。
申请人信息
- 申请人:北京搜狐新媒体信息技术有限公司
- 申请人地址:100190 北京市海淀区科学院南路2号院3号楼12层1201
- 发明人: 北京搜狐新媒体信息技术有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种提升模型训练速度的方法、系统、设备及存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410207789.1 |
| 申请日 | 2024/2/26 |
| 公告号 | CN117806832A |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06F9/50 |
| 权利人 | 北京搜狐新媒体信息技术有限公司 |
| 发明人 | 廖忠儒 |
| 地址 | 北京市海淀区科学院南路2号院3号楼12层1201 |
专利主权项内容
1.一种提升模型训练速度的方法,其特征在于,包括:获取指定时间范围内的所有样本文件路径,按时间先后顺序,依次执行如下操作:获取目标时间的样本文件路径内的样本,使用分布式系统和映射表,将样本内的样本特征映射为特征行号,并保存到目标时间的行号文件路径的行号文件里;获取指定时间范围内的所有行号文件路径,按时间先后顺序,依次执行如下操作:获取目标时间的行号文件路径内的特征行号,使用特征行号获取特征参数进行模型训练。。来自马-克-数-据-官网