← 返回列表

档案分类方法及平台

申请号: CN202410117785.4
申请人: 河北省中医院
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 档案分类方法及平台
专利类型 发明申请
申请号 CN202410117785.4
申请日 2024/1/29
公告号 CN117648473A
公开日 2024/3/5
IPC主分类号 G06F16/906
权利人 河北省中医院
发明人 吉晓雯
地址 河北省石家庄市长安区中山东路389号

摘要文本

本公开提供了一种档案分类方法及平台,属于数据分类技术领域,该方法包括:获取用户预先设定的多级分类类别,基于预设的映射关系确定多级分类类别对应的词组权重。词组权重为每个标准词组对应的权重。获取待分类的第一档案,提取第一档案中的词组,得到多个第一词组。将多个第一词组转换为多个对应的标准词组,得到多个目标标准词组。基于目标标准词组以及词组权重生成第一档案的特征向量。将第一档案的特征向量输入至预先训练的分类器中,得到第一档案对应的分类类别。本公开提供的档案分类方法能够自动对不同内容的档案进行分类,针对不同的级别顺序实现不同的分类结果,以达到更加全面智能的档案分类效果。

专利主权项内容

1.一种档案分类方法,其特征在于,包括:获取用户预先设定的多级分类类别,基于所述多级分类类别的级别顺序确定词组权重;所述词组权重为每个标准词组对应的权重;获取待分类的第一档案,提取所述第一档案中的词组,得到多个第一词组;将所述多个第一词组转换为多个对应的标准词组,得到多个目标标准词组;基于所述目标标准词组以及所述词组权重生成所述第一档案的特征向量;将所述第一档案的特征向量输入至预先训练的分类器中,得到所述第一档案对应的所述分类类别。