一种场景文本分割方法、系统、设备及介质

申请号: CN202311699548.5

申请人: 南昌航空大学

申请日期: 2023/12/12

摘要文本

本发明公开一种场景文本分割方法、系统、设备及介质，涉及图像分割技术领域，方法包括：采用训练集训练场景文本分割网络得到场景文本分割模型；场景文本分割网络包括相连的粗粒度文本分割模块和卷积细化模块，卷积细化模块的输出与粗粒度文本分割模块的输出逐像素相加作为场景文本分割网络的输出；粗粒度文本分割模块为SegFromer网络；网络训练时SegFromer网络增加第一多层感知机，SegFromer网络中的MLP Layers的输出与第一多层感知机连接，第一多层感知机输出的4个预测结果与场景文本分割网络输出的1个预测结果用于对场景文本分割网络进行监督训练。本发明提高了文本分割的准确性。

申请人信息

申请人:南昌航空大学
申请人地址:330063 江西省南昌市丰和南大道696号
发明人: 南昌航空大学

专利详细信息

项目	内容
专利名称	一种场景文本分割方法、系统、设备及介质
专利类型	发明申请
申请号	CN202311699548.5
申请日	2023/12/12
公告号	CN117671692A
公开日	2024/3/8
IPC主分类号	G06V30/148
权利人	南昌航空大学
发明人	杨素华; 江少锋; 周振浪; 赵富臣
地址	江西省南昌市丰和南大道696号

专利主权项内容

1.一种场景文本分割方法，其特征在于，包括：采用训练集训练场景文本分割网络，得到场景文本分割模型；所述场景文本分割网络包括粗粒度文本分割模块和卷积细化模块，所述粗粒度文本分割模块的输出连接所述卷积细化模块的输入，所述卷积细化模块的输出与所述粗粒度文本分割模块的输出逐像素相加作为所述场景文本分割网络的输出；所述粗粒度文本分割模块为SegFromer网络；所述卷积细化模块用于对所述粗粒度文本分割模块的输出进行细粒度分割；采用所述场景文本分割模型对待分割图像进行文本分割，得到场景文本分割结果；所述场景文本分割网络训练时，所述SegFromer网络增加第一多层感知机，所述SegFromer网络中的MLP Layers的输出与第一多层感知机连接，所述第一多层感知机输出的4个文本分割特征图与所述场景文本分割网络输出的1个文本分割特征图用于对所述场景文本分割网络进行监督训练。

一种场景文本分割方法、系统、设备及介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

一种场景文本分割方法、系统、设备及介质

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢