基于深度学习和计算机视觉的甲骨文字检测方法
摘要文本
本发明涉及人工智能与古文字方向交叉技术领域,特别是涉及基于深度学习和计算机视觉的甲骨文字检测方法,包括:获取待检测甲骨文拓片;将所述甲骨文拓片输入预设的检测模型中,获取所述甲骨文拓片上的甲骨文字区域预测结果,其中,所述检测模型基于训练集训练获得,所述训练集包括甲骨文拓片图像和甲骨文单字图像,所述检测模型采用轻量级神经网络构建。本发明充分利用已有甲骨文字体数据,借助深度学习算法,将甲骨文字的结构先验信息引入到检测模型中,使深度学习模型在优化的过程中学习并利用甲骨文字特有的形状特征,正确区分文字与非文字区域,提升甲骨文字检测结果的准确性。
申请人信息
- 申请人:吉林大学
- 申请人地址:130012 吉林省长春市高新产业开发区前进大街2699号
- 发明人: 吉林大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于深度学习和计算机视觉的甲骨文字检测方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311753411.3 |
| 申请日 | 2023/12/20 |
| 公告号 | CN117437647B |
| 公开日 | 2024/3/26 |
| IPC主分类号 | G06V30/19 |
| 权利人 | 吉林大学 |
| 发明人 | 付新然; 杨溪; 周日鑫 |
| 地址 | 吉林省长春市前进大街2699号 |
专利主权项内容
1.基于深度学习和计算机视觉的甲骨文字检测方法,其特征在于,包括:获取待检测甲骨文拓片;将所述甲骨文拓片输入预设的检测模型中,获取所述甲骨文拓片上的甲骨文字区域预测结果,其中,所述检测模型基于训练集训练获得,所述训练集包括甲骨文拓片图像和甲骨文单字图像,所述检测模型采用轻量级神经网络构建;所述检测模型包括:骨干网络模块、类别预测模块、区域预测模块,所述骨干网络模块用于通过卷积运算提取输入图像的特征图;所述类别预测模块用于基于所述特征图进行类别预测,获取类别预测图;所述区域预测模块用于基于所述类别预测图和特征图融合后进行区域预测,输出区域预测图;所述骨干网络模块采用编码器-解码器骨干网络,所述类别预测模块采用若干残差结构组成的卷积网络,所述区域预测模块采用转置卷积网络、批量归一化层;基于所述训练集训练所述检测模型之前,还包括对所述训练集进行预处理,所述预处理包括:对所述甲骨文拓片图像上甲骨文字进行位置标注,标注的格式是矩形边界框的左下角顶点坐标和右上角顶点坐标;对所述甲骨文单字图像进行分类,相同的甲骨文单字被分为同一类别;在所述检测模型训练过程中,通过对所述类别预测图和区域预测图进行监督,使用梯度下降法更新模型参数;在所述检测模型训练过程中,还包括为甲骨文字提供类别伪标签,得到所述类别伪标签后,根据二维高斯分布生成用于监督类别信息的伪标签图,获取所述类别伪标签的过程包括:输入甲骨文单字图像到残差神经网络中,输出所述甲骨文单字图像的高维向量;将所述高维向量输入到类别预测器中,输出所述甲骨文单字图像属于各个类别的概率,选取最高概率的类别作为所述甲骨文单字图像的类别,获取所述类别伪标签;所述甲骨文字区域预测结果表示形式为甲骨文字的矩形包围框的参数,包括左下角的像素坐标和右上角的像素坐标。