← 返回列表

一种文档切分方法、装置、设备及可读存储介质

申请号: CN202311549681.2
申请人: 北京中关村科金技术有限公司
申请日期: 2023/11/20

摘要文本

本申请公开了一种文档切分方法、装置、设备及可读存储介质,涉及计算机技术领域,以提高获得的文档片段的质量和相关性。该方法包括:将待处理文档进行第一切分,得到至少一个文档片段;将所述至少一个文档片段进行分类,得到第一类型文档片段和第二类型文档片段;对所述第一类型文档片段进行第一文档切分处理,得到至少一个第一类型文档片段;对所述第二类型文档片段进行第二文档切分处理,得到至少一个第二类型文档片段;利用所述至少一个第一类型文档片段和所述至少一个第二类型文档片段,得到文档切分片段集合。本申请实施例可以提高获得的文档片段的质量和相关性。

专利详细信息

项目 内容
专利名称 一种文档切分方法、装置、设备及可读存储介质
专利类型 发明申请
申请号 CN202311549681.2
申请日 2023/11/20
公告号 CN117520549A
公开日 2024/2/6
IPC主分类号 G06F16/35
权利人 北京中关村科金技术有限公司
发明人 贾敬伍; 于皓; 张杰
地址 北京市海淀区上地四街一号院5号楼一层130

专利主权项内容

1.一种文档切分方法,其特征在于,包括:将待处理文档进行第一切分,得到至少一个文档片段;将所述至少一个文档片段进行分类,得到第一类型文档片段和第二类型文档片段;对所述第一类型文档片段进行第一文档切分处理,得到至少一个第一类型文档片段;对所述第二类型文档片段进行第二文档切分处理,得到至少一个第二类型文档片段;利用所述至少一个第一类型文档片段和所述至少一个第二类型文档片段,得到文档切分片段集合。