← 返回列表
文本分类模型的训练和使用方法、装置、设备和介质
申请人信息
- 申请人:腾讯科技(深圳)有限公司
- 申请人地址:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 发明人: 腾讯科技(深圳)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 文本分类模型的训练和使用方法、装置、设备和介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410130515.7 |
| 申请日 | 2024/1/31 |
| 公告号 | CN117668562A |
| 公开日 | 2024/3/8 |
| IPC主分类号 | G06F18/214 |
| 权利人 | 腾讯科技(深圳)有限公司 |
| 发明人 | 何宇; 汪翔 |
| 地址 | 广东省深圳市南山区高新区科技中一路腾讯大厦35层 |
摘要文本
本申请公开了一种文本分类模型的训练和使用方法、装置、设备和介质,属于数据分类领域。文本分类模型包括第一分类器、第二分类器和集成分类器,该方法包括:获取第一样本数据和第二样本数据,第一样本数据用于表示不带有关键词的第一文本,第二样本数据用于表示带有关键词的第二文本;基于第一样本数据,通过第一分类器获取第一结果数据,以及基于第二样本数据,通过第二分类器获取第二结果数据,第一分类器用于预测第一文本的类型,第二分类器用于预测第二文本的类型;基于第一结果数据和第二结果数据,构建n棵决策树以形成集成分类器。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。 来自马-克-数-据
专利主权项内容
1.一种文本分类模型的训练方法,其特征在于,所述文本分类模型包括第一分类器、第二分类器和集成分类器,所述方法包括:获取第一样本数据和第二样本数据,所述第一样本数据用于表示不带有关键词的第一文本,所述第二样本数据用于表示带有所述关键词的第二文本,所述关键词是影响目标字符串的分类结果的字符,所述第一文本和所述第二文本均包括所述目标字符串;基于所述第一样本数据,通过所述第一分类器获取第一结果数据,以及基于所述第二样本数据,通过所述第二分类器获取第二结果数据,所述第一分类器用于预测所述第一文本的类型,所述第二分类器用于预测所述第二文本的类型;基于所述第一结果数据和所述第二结果数据,构建n棵决策树以形成所述集成分类器,所述集成分类器用于预测所述第一文本、所述第二文本中至少之一的类型,n为大于1的正整数。