一种基于大模型的商标生成方法及系统
摘要文本
本发明公开了一种基于大模型的商标生成方法及系统,该方法包括训练数据构建、大模型的训练、评分模型的训练、大模型强化训练、大模型生成商标以及用户数据再收集并模型再训练的步骤,可以真实的模拟用户的需求,在训练数据构建阶段尽可能多的生成各种情况的需求指令,通过结合用户的偏好数据,训练基于用户偏好的评分模型控制大模型生成出用户更加喜欢的商标名称。同时还可不断的收集用户选取商标的数据,不断的对大模型进行迭代优化,逐步提升大模型的效果,使得模型生成出来的商标更加贴近用户的需求和期望。
申请人信息
- 申请人:北京知呱呱科技有限公司; 知呱呱(天津)大数据技术有限公司
- 申请人地址:100089 北京市海淀区长春桥路11号3号、4号楼裙房四层401-1号
- 发明人: 北京知呱呱科技有限公司; 知呱呱(天津)大数据技术有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于大模型的商标生成方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311646442.9 |
| 申请日 | 2023/12/4 |
| 公告号 | CN117521604A |
| 公开日 | 2024/2/6 |
| IPC主分类号 | G06F40/166 |
| 权利人 | 北京知呱呱科技有限公司; 知呱呱(天津)大数据技术有限公司 |
| 发明人 | 尤元岳; 范娥媚; 徐青伟; 严长春; 裴非 |
| 地址 | 北京市海淀区长春桥路11号3号、4号楼裙房四层401-1号; 天津市河西区黑牛城道南侧四信大厦1号楼806A |
专利主权项内容
1.一种基于大模型的商标生成方法,其特征在于,包括训练数据构建、大模型训练、评分模型训练、大模型强化训练、大模型生成商标和用户数据再收集并模型再训练的步骤,其中,步骤一、训练数据构建:收集商标生成任务的训练数据集,所述训练数据集包括:第一训练数据为商标要求,第一训练数据的标签为符合该要求的商标名称;第二训练数据为商标名称,第二训练数据的标签为该商标名称的解释性文本内容;所述任务包括第一个任务是通过商标的要求文本内容生成符合要求的商标和第二个任务是给定一个商标名称生成当前商标的解释性文本;步骤二、大模型训练:将所获取到的训练数据融合在一起,按照预定比例的数据比例占比,将所述第一训练数据与所述第二训练数据结合在一起,送至大模型进行训练;步骤三、评分模型训练:基于训练后的大模型,依据所述两个任务分别在同样的指令下生成若干条数据,对所述若干条数据进行标注、排名;通过标注的排序数据,进行训练,从而得到给定的一个输入,如果该输入更加偏向于人的偏好,则给出更高的分数;步骤四、对大模型进行强化训练:配合训练好的所述评分模型,再次使用第一次大模型训练时的数据,使大模型通过对应的指令生成对应的商标名称,所述评分模型对所述商标名称进行评分,使大模型生成出的结果在评分模型部分获得更高的分数;步骤五、商标名及文本生成:在商标名及文本生成阶段,将用户的需求进行整理以及处理,形成与训练阶段训练数据输入格式一致的指令,将该指令送至大模型当中,从而生成对应的商标名称;将所生成的商标名称再次以训练阶段相同的数据输入指令送入至大模型,使得大模型生成该商标名称的解释性文本内容;步骤六、用户数据再收集、模型再训练:模型上线后,收集用户挑选的数据,当用户挑选的数据进一步积累到预定程度,将该部分数据融合至最开始的训练语料当中,再次进行评分模型训练,进行大模型的二次训练,以更新大模型。