← 返回列表

文本分类模型的训练和使用方法、装置、设备和介质

申请号: CN202410130515.7
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 文本分类模型的训练和使用方法、装置、设备和介质
专利类型 发明申请
申请号 CN202410130515.7
申请日 2024/1/31
公告号 CN117668562A
公开日 2024/3/8
IPC主分类号 G06F18/214
权利人 腾讯科技(深圳)有限公司
发明人 何宇; 汪翔
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

本申请公开了一种文本分类模型的训练和使用方法、装置、设备和介质,属于数据分类领域。文本分类模型包括第一分类器、第二分类器和集成分类器,该方法包括:获取第一样本数据和第二样本数据,第一样本数据用于表示不带有关键词的第一文本,第二样本数据用于表示带有关键词的第二文本;基于第一样本数据,通过第一分类器获取第一结果数据,以及基于第二样本数据,通过第二分类器获取第二结果数据,第一分类器用于预测第一文本的类型,第二分类器用于预测第二文本的类型;基于第一结果数据和第二结果数据,构建n棵决策树以形成集成分类器。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。 来自马-克-数-据

专利主权项内容

1.一种文本分类模型的训练方法,其特征在于,所述文本分类模型包括第一分类器、第二分类器和集成分类器,所述方法包括:获取第一样本数据和第二样本数据,所述第一样本数据用于表示不带有关键词的第一文本,所述第二样本数据用于表示带有所述关键词的第二文本,所述关键词是影响目标字符串的分类结果的字符,所述第一文本和所述第二文本均包括所述目标字符串;基于所述第一样本数据,通过所述第一分类器获取第一结果数据,以及基于所述第二样本数据,通过所述第二分类器获取第二结果数据,所述第一分类器用于预测所述第一文本的类型,所述第二分类器用于预测所述第二文本的类型;基于所述第一结果数据和所述第二结果数据,构建n棵决策树以形成所述集成分类器,所述集成分类器用于预测所述第一文本、所述第二文本中至少之一的类型,n为大于1的正整数。