← 返回列表
一种语言模型训练方法、构建方法和装置
摘要文本
本申请实施例公开了一种语言模型训练方法,所述方法包括:终端确定第一语言模型;终端通过本地生成的历史输入数据对第一语言模型进行训练得到训练后的第一语言模型;终端向服务器发送训练后的第一语言模型的第一模型参数,第一模型参数用于确定第二语言模型的第二模型参数;第二语言模型用于为终端展示联想得到的候选项。可见,在得到第二语言模型的过程中,包含有用户隐私的历史输入数据均在终端本地通过第一语言模型进行训练,无需向服务器上传原始的历史输入数据,故降低了用户隐私信息暴露的风险,且终端上传到服务器的也仅是训练后的第一语言模型的第一模型参数,上传的数据量相对较少,提高了得到第二语言模型过程中终端的上传效率。
申请人信息
- 申请人:北京搜狗科技发展有限公司
- 申请人地址:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
- 发明人: 北京搜狗科技发展有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种语言模型训练方法、构建方法和装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810682370.6 |
| 申请日 | 2018年6月27日 |
| 公告号 | CN110648657B |
| 公开日 | 2024年2月2日 |
| IPC主分类号 | G10L15/06 |
| 权利人 | 北京搜狗科技发展有限公司 |
| 发明人 | 黄海兵; 庞帅; 张扬 |
| 地址 | 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |
专利主权项内容
1.一种语言模型训练方法,其特征在于,所述方法包括:终端确定第一语言模型;所述终端通过本地生成的历史输入数据对所述第一语言模型进行训练得到训练后的第一语言模型;所述终端向服务器发送所述训练后的第一语言模型的第一模型参数,所述第一模型参数用于确定第二语言模型的第二模型参数;所述第二语言模型用于为所述终端展示联想得到的候选项。