← 返回列表
一种信息分析模型的训练方法及信息分析方法
申请人信息
- 申请人:城云科技(中国)有限公司
- 申请人地址:310052 浙江省杭州市滨江区长河街道江南大道588号恒鑫大厦主楼17层、18层
- 发明人: 城云科技(中国)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种信息分析模型的训练方法及信息分析方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410057458.4 |
| 申请日 | 2024/1/16 |
| 公告号 | CN117574981A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G06N3/08 |
| 权利人 | 城云科技(中国)有限公司 |
| 发明人 | 郁强; 黄宸; 曹鹏寅; 李斌; 任通 |
| 地址 | 浙江省杭州市滨江区长河街道江南大道588号恒鑫大厦主楼17层、18层 |
摘要文本
本申请提出了一种信息分析模型的训练方法及信息分析方法,包括以下步骤:获取信息分析数据并输入到预训练好的T5模型中得到第一信息分析结果;构建自建模型,在所述训练样本中获取至少一信息分析数据组成信息分析集合,以第一信息分析结果为训练目标,以信息分析集合为训练数据对所述自建模型进行训练得到普适模型;构建数据校正模型并获取微调数据集,使用微调数据集对自建模型进行迭代训练得到信息分析模型,所述数据校正模型在迭代训练过程中对微调数据集进行更新。本方案以T5模型的输出为训练目标来构建自建模型,并对其进行迭代训练得到信息分析模型,从而使用信息分析模型以更小的计算资源来进行信息分析。
专利主权项内容
1.一种信息分析模型的训练方法,其特征在于,包括以下步骤:获取至少一与信息分析相关的信息分析数据并标记对应的情感标签作为训练样本,将训练样本输入到预训练好的T5模型中得到第一信息分析结果;构建以transfomer架构为基础的自建模型,在所述训练样本中获取至少一信息分析数据组成信息分析集合,以信息分析集合为输入数据,以信息分析集合对应的第一信息分析结果为训练目标对所述自建模型进行训练得到普适模型;构建识别数据集错误的数据校正模型并获取标记有情感标签的微调数据集,冻结预训练好的普适模型的部分层级并新增分类头,将标记有情感标签的微调数据集输入到普适模型中进行迭代训练得到信息分析模型,其中在迭代训练过程中将普适模型输出的结果输入到数据校正模型中更新微调数据集,并将更新的微调数据集再输入到普适模型进行迭代。