← 返回列表

一种场景文本分割方法、系统、设备及介质

申请号: CN202311699548.5
申请人: 南昌航空大学
申请日期: 2023/12/12

摘要文本

本发明公开一种场景文本分割方法、系统、设备及介质,涉及图像分割技术领域,方法包括:采用训练集训练场景文本分割网络得到场景文本分割模型;场景文本分割网络包括相连的粗粒度文本分割模块和卷积细化模块,卷积细化模块的输出与粗粒度文本分割模块的输出逐像素相加作为场景文本分割网络的输出;粗粒度文本分割模块为SegFromer网络;网络训练时SegFromer网络增加第一多层感知机,SegFromer网络中的MLP Layers的输出与第一多层感知机连接,第一多层感知机输出的4个预测结果与场景文本分割网络输出的1个预测结果用于对场景文本分割网络进行监督训练。本发明提高了文本分割的准确性。

专利详细信息

项目 内容
专利名称 一种场景文本分割方法、系统、设备及介质
专利类型 发明申请
申请号 CN202311699548.5
申请日 2023/12/12
公告号 CN117671692A
公开日 2024/3/8
IPC主分类号 G06V30/148
权利人 南昌航空大学
发明人 杨素华; 江少锋; 周振浪; 赵富臣
地址 江西省南昌市丰和南大道696号

专利主权项内容

1.一种场景文本分割方法,其特征在于,包括:采用训练集训练场景文本分割网络,得到场景文本分割模型;所述场景文本分割网络包括粗粒度文本分割模块和卷积细化模块,所述粗粒度文本分割模块的输出连接所述卷积细化模块的输入,所述卷积细化模块的输出与所述粗粒度文本分割模块的输出逐像素相加作为所述场景文本分割网络的输出;所述粗粒度文本分割模块为SegFromer网络;所述卷积细化模块用于对所述粗粒度文本分割模块的输出进行细粒度分割;采用所述场景文本分割模型对待分割图像进行文本分割,得到场景文本分割结果;所述场景文本分割网络训练时,所述SegFromer网络增加第一多层感知机,所述SegFromer网络中的MLP Layers的输出与第一多层感知机连接,所述第一多层感知机输出的4个文本分割特征图与所述场景文本分割网络输出的1个文本分割特征图用于对所述场景文本分割网络进行监督训练。