← 返回列表
分布式独热编码方法、装置、电子设备及计算机存储介质
摘要文本
天津医康互联科技有限公司取得“一种透气窗帘布”专利技术,本申请提供了一种分布式独热编码方法、装置、电子设备及计算机存储介质,其中,该方法包括:获取各个参与方的局部类别特征集合,局部类别特征集合为各个参与方的本地数据去重后得到的类别特征集合;根据局部类别特征集合生成全局编码器;将全局编码器发送到各个参与方,全局编码器用于对各个参与方的本地数据进行独热编码。本申请的服务器收集的是局部类别特征集合,可以保护各方之间数据传输的隐私和安全。另外,所有的参与方都根据全局编码器进行编码,以使所有参与方都使用相同的编码方式对本地数据进行编码,可以避免各个参与方的数据编码后的独热编码向量出现不一致或冲突的情况,便于各个参与方的数据统一与管理。
专利主权项内容
1.一种分布式独热编码方法,其特征在于,应用于服务器,包括:获取各个参与方的局部类别特征集合,所述局部类别特征集合为所述各个参与方的本地数据去重后得到的类别特征集合;根据所述局部类别特征集合生成全局编码器;将所述全局编码器发送到所述各个参与方,所述全局编码器用于对所述各个参与方的所述本地数据进行独热编码;所述据所述局部类别特征集合生成全局编码器,包括:对获取到的所有所述局部类别特征集合进行去重、聚合处理,得到全局类别特征集合;根据所述全局类别特征集合生成全局编码器;所述根据所述全局类别特征集合生成全局编码器,包括:将所述全局类别特征集合中的每个类别特征的每个取值转换为一个独热编码向量,并根据多个所述全局类别特征集合对应的多个独热编码向量生成所述全局编码器;所述全局编码器中包括每个类别特征的名称及对应的具体编码值。。来自马-克-数-据
专利申请信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 分布式独热编码方法、装置、电子设备及计算机存储介质 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311744887.0 |
| 申请日 | 2023/12/19 |
| 公告号 | CN117424765B |
| 公开日 | 2024/3/22 |
| IPC主分类号 | H04L9/40 |
| 权利人 | 天津医康互联科技有限公司 |
| 发明人 | 王德健; 王慧东; 董科雄 |
| 地址 | 天津市滨海新区滨海科技园日新道188号3号楼4-B-21 |