← 返回列表

一种提升模型训练速度的方法、系统、设备及存储介质

申请号: CN202410207789.1
申请人: 北京搜狐新媒体信息技术有限公司
申请日期: 2024/2/26

摘要文本

本申请公开一种提升模型训练速度的方法、系统、设备及存储介质,应用于模型训练领域,通过获取指定时间范围内的所有样本文件路径,按时间先后顺序,依次执行如下操作:获取目标时间的样本文件路径内的样本,使用分布式系统和映射表,将样本内的样本特征映射为特征行号,并保存到目标时间的行号文件路径的行号文件里;获取指定时间范围内的所有行号文件路径,按时间先后顺序,依次执行如下操作:获取目标时间的行号文件路径内的特征行号,使用特征行号获取特征参数进行模型训练,独立运行根据特征获取特征行号,以及根据特征行号获取特征参数两个环节,并对第一个环节使用分布式系统加速,从而提升模型训练速度。

专利详细信息

项目 内容
专利名称 一种提升模型训练速度的方法、系统、设备及存储介质
专利类型 发明申请
申请号 CN202410207789.1
申请日 2024/2/26
公告号 CN117806832A
公开日 2024/4/2
IPC主分类号 G06F9/50
权利人 北京搜狐新媒体信息技术有限公司
发明人 廖忠儒
地址 北京市海淀区科学院南路2号院3号楼12层1201

专利主权项内容

1.一种提升模型训练速度的方法,其特征在于,包括:获取指定时间范围内的所有样本文件路径,按时间先后顺序,依次执行如下操作:获取目标时间的样本文件路径内的样本,使用分布式系统和映射表,将样本内的样本特征映射为特征行号,并保存到目标时间的行号文件路径的行号文件里;获取指定时间范围内的所有行号文件路径,按时间先后顺序,依次执行如下操作:获取目标时间的行号文件路径内的特征行号,使用特征行号获取特征参数进行模型训练。。来自马-克-数-据-官网