一种标准文件档案一体化管理的编码与展示方法
摘要文本
搜索专利查询网 。本发明公开了一种标准文件档案一体化管理的编码与展示方法,包括获取待编码文件档案,对所述待编码文件档案进行预处理,提取相关信息,提取所述相关信息的标准特征,根据所述标准特征获取所述待编码文件档案的分类数据,将所述程序等级和所述分类数据关联获得标准分类数据,使用所述标准分类数据构建信息树,制定编码方案,根据所述编码方案构建标准文件档案编码模型,根据编码类型优化所述标准文件档案编码模型,将所述信息树输入优化后的所述标准文件档案编码模型,输出编码结果并展示。该方法不仅可以提高编码的精度,同时具有较好的可解释性,可以直接应用于标准文件档案系统中。
申请人信息
- 申请人:中国标准化研究院
- 申请人地址:100191 北京市海淀区知春路4号
- 发明人: 中国标准化研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种标准文件档案一体化管理的编码与展示方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311355172.6 |
| 申请日 | 2023/10/19 |
| 公告号 | CN117349243A |
| 公开日 | 2024/1/5 |
| IPC主分类号 | G06F16/16 |
| 权利人 | 中国标准化研究院 |
| 发明人 | 张敬娟; 王春艳; 李晶; 张欣亮; 于帆 |
| 地址 | 北京市海淀区知春路4号 |
专利主权项内容
1.一种标准文件档案一体化管理的编码与展示方法,其特征在于,包括以下步骤:A获取待编码文件档案,对所述待编码文件档案进行预处理,提取预处理后的所述待编码文件档案的材料类型、项目类别和程序等级获得相关信息;B提取所述相关信息的标准特征,根据所述标准特征获取所述待编码文件档案的分类数据,将所述程序等级和所述分类数据关联获得标准分类数据;C使用所述标准分类数据构建信息树,制定编码方案;D根据所述编码方案构建标准文件档案编码模型,根据编码类型优化所述标准文件档案编码模型;根据所述编码方案构建标准文件档案编码模型的方法,包括:标准文件档案编码模型采用分层编码算法、哈希查找算法和插入算法构建,采用插入算法进行标准文件档案的更新和去重,其中计算标准文件档案内容的相似度:其中第i个标准文件档案为d,第j个标准文件档案为d,特征向量的维数为h,特征向量h维数的数量为q,第i个标准文件档案第h个特征项的权重值为ω,第j个标准文件档案第h个特征项的权重值为ω,通过相似度进行标准文件档案的数据更新和去重,根据所述编码方案采用分层编码算法对更新去重后的标准文件档案进行编码,采用哈希查找算法对编码后的标准文件档案建立索引,使用随机森林算法将信息树按照4 : 1随机分成训练集和测试集,通过训练集训练标准文件档案编码模型,采用测试集对训练后的标准文件档案编码模型进行结果测试;ijihjhE将所述信息树输入优化后的所述标准文件档案编码模型,输出编码结果并展示。