← 返回列表
数据训练方法及装置、存储介质、电子装置
摘要文本
本发明提供了一种数据训练方法及装置、存储介质、电子装置,其中,该方法包括:确定样本数据和可用的集群资源;将总训练模型拆分为多个子模型;使用集群资源在多个子模型上并行训练样本数据。通过本发明,解决了相关技术中训练样本数据效率过低的技术问题。 来自马克数据网
申请人信息
- 申请人:中兴通讯股份有限公司
- 申请人地址:518057 广东省深圳市南山区科技南路55号
- 发明人: 中兴通讯股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 数据训练方法及装置、存储介质、电子装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN201711488171.3 |
| 申请日 | 2017年12月29日 |
| 公告号 | CN109993299B |
| 公开日 | 2024年2月27日 |
| IPC主分类号 | G06N3/08 |
| 权利人 | 中兴通讯股份有限公司 |
| 发明人 | 韩炳涛 |
| 地址 | 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦 |
专利主权项内容
1.一种数据训练方法,其特征在于,包括:通过处理器执行以下步骤:确定样本数据和可用的集群资源;将总训练模型拆分为多个子模型;使用所述集群资源在所述多个子模型上并行训练所述样本数据;其中,将总训练模型拆分为多个子模型包括以下至少之一:将所述总训练模型拆分为多个第一子模型,其中,所述多个第一子模型并行连接;将所述总训练模型拆分为多个第二子模型,其中,所述多个第二子模型串行连接;其中,将所述总训练模型拆分为多个第一子模型:根据算子的类型将所述总训练模型拆分为多个第一子模型,其中,所述总训练模型由一个或多个所述算子组成;其中,使用所述集群资源在所述多个子模型上并行训练所述样本数据包括:将所述样本数据划分为M个分片后,并行输入到所述集群资源的M*K个子模型上进行训练,其中, K为配置一个子模型所需要的最小集群资源,M为大于0的整数,K为大于0的整数;其中,确定样本数据和可用的集群资源包括:接收训练作业,从所述训练作业中获取对应的样本数据;确定集群资源中当前空闲的处理器资源,其中,所述集群资源包括所述处理器资源。