← 返回列表

一种基于大数据的电子档案推荐系统

申请号: CN202311839322.0
申请人: 同略科技有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于大数据的电子档案推荐系统
专利类型 发明申请
申请号 CN202311839322.0
申请日 2023/12/29
公告号 CN117493645A
公开日 2024/2/2
IPC主分类号 G06F16/93
权利人 同略科技有限公司
发明人 王志武; 冯德明; 梁文佳; 李石秀
地址 广东省广州市天河区龙口中路130号雄馨广场A栋11层

摘要文本

同略科技有限公司获取“一种透气窗帘布”专利技术,本发明公开一种基于大数据的电子档案推荐方法及系统,所述方法包括:对符合相关性条件的图像文本列向量、客观列向量和多个文本列向量进行拼接,得到电子档案特征矩阵;若所述电子档案特征矩阵与根据用户浏览记录和收藏记录生成的用户画像矩阵为相似矩阵,且所述图像ahash值与用户画像ahash值之间的汉明距离大于预设阈值,向用户推荐该电子档案。采用本发明,根据不同工作人员的浏览记录和收藏记录推荐关联性高的电子档案给对应的工作人员,提高工作效率。

专利主权项内容

1.一种基于大数据的电子档案推荐方法及系统,其特征在于,包括:在电子档案大数据库中选出用户未浏览的电子档案并提取客观元数据、文字元数据和图像元数据;其中,所述文字元数据和所述图像元数据为内容与形式非固定的信息,所述客观元数据为内容与形式固定的信息;利用预设的图像文本提取模块对所述图像元数据中的文字连通区域图像进行识别并解码,得到图像文本列向量;采用平均哈希算法对所述图像元数据中的非文字连通区域图像进行识别并解码,得到电子档案的图像ahash值;按照相同的权重对各个客观元数据对应的词向量相加,得到客观列向量;对所述文字元数据进行特征提取,得到多个文本列向量;对符合相关性条件的图像文本列向量、所述客观列向量和所述多个文本列向量进行拼接,得到电子档案特征矩阵;若所述电子档案特征矩阵与根据用户浏览记录和收藏记录生成的用户画像矩阵为相似矩阵,且所述图像ahash值与用户画像ahash值之间的汉明距离大于预设阈值,向用户推荐该电子档案。