文本分类模型的训练和使用方法、装置、设备和介质

申请号: CN202410130515.7

申请人: 腾讯科技(深圳)有限公司

更新日期: 2026-03-17

摘要文本

腾讯科技(深圳)有限公司取得“一种透气窗帘布”专利技术，本申请公开了一种文本分类模型的训练和使用方法、装置、设备和介质，属于数据分类领域。文本分类模型包括第一分类器、第二分类器和集成分类器，该方法包括：获取第一样本数据和第二样本数据，第一样本数据用于表示不带有关键词的第一文本，第二样本数据用于表示带有关键词的第二文本；基于第一样本数据，通过第一分类器获取第一结果数据，以及基于第二样本数据，通过第二分类器获取第二结果数据，第一分类器用于预测第一文本的类型，第二分类器用于预测第二文本的类型；基于第一结果数据和第二结果数据，构建n棵决策树以形成集成分类器。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。来自马-克-数-据

专利主权项内容

1.一种文本分类模型的训练方法，其特征在于，所述文本分类模型包括第一分类器、第二分类器和集成分类器，所述方法包括：获取第一样本数据和第二样本数据，所述第一样本数据用于表示不带有关键词的第一文本，所述第二样本数据用于表示带有所述关键词的第二文本，所述关键词是影响目标字符串的分类结果的字符，所述第一文本和所述第二文本均包括所述目标字符串；基于所述第一样本数据，通过所述第一分类器获取第一结果数据，以及基于所述第二样本数据，通过所述第二分类器获取第二结果数据，所述第一分类器用于预测所述第一文本的类型，所述第二分类器用于预测所述第二文本的类型；基于所述第一结果数据和所述第二结果数据，构建n棵决策树以形成所述集成分类器，所述集成分类器用于预测所述第一文本、所述第二文本中至少之一的类型，n为大于1的正整数。

专利申请信息

项目	内容
专利名称	文本分类模型的训练和使用方法、装置、设备和介质
专利类型	发明申请
申请号	CN202410130515.7
申请日	2024/1/31
公告号	CN117668562A
公开日	2024/3/8
IPC主分类号	G06F18/214
权利人	腾讯科技(深圳)有限公司
发明人	何宇; 汪翔
地址	广东省深圳市南山区高新区科技中一路腾讯大厦35层

文本分类模型的训练和使用方法、装置、设备和介质

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

文本分类模型的训练和使用方法、装置、设备和介质

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

阻抗检测电路、阻抗检测设备及阻抗检测方法

下一跳资源的更新方法、装置、终端设备及存储介质

一种生活垃圾密度分离装置

一种抑制漏电的N型MOS管

一种水下运载器搭载式深海沉积物取样设备

请求处理方法、装置、电子设备、系统及存储介质

热门技术领域

快速入口

专利技术资料