[發明專利]一種即插即用的單字分割器在審
| 申請號: | 202011387546.9 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN113361531A | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 方徐偉;張校;張帥;徐小龍;謝巍盛 | 申請(專利權)人: | 天翼電子商務有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 102200 北京市昌平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 即插即用 單字 分割 | ||
本發明公開了一種即插即用的單字分割器,具體包括以下步驟:S1.建立網絡架構;S2.Label生成和S3.Loss函數。本發明提出了一種基于深度學習的單字分割方法,可以接在文本行分割之后,實現單字分割,即插即用,方便魯棒并且實時使用,適用于復雜的場景文本。
技術領域
本發明涉及文本檢測領域,特別涉及一種即插即用的單字分割器。
背景技術
在OCR領域主要分為文本檢測和文本識別,對于文本檢測,目前的主要研究在文本行的檢測,一系列的技術包括,ctpn,east,psenet,dbnet等等。但是這些是基于文本行的檢測,也有一些研究在單字分割上,但主要采用傳統方式,例如行列投影法,直方圖分割等等。這些方式魯棒性極差,不適用于復雜的場景文本。
發明內容
本發明要解決的技術問題是克服現有技術的缺陷,提供一種即插即用的單字分割器,提出了一種基于深度學習的單字分割方法,可以接在文本行分割之后,實現單字分割,即插即用,方便魯棒并且實時。
為了解決上述技術問題,本發明提供了如下的技術方案:
本發明一種即插即用的單字分割器,具體包括以下步驟:
S1.建立網絡架構:
網絡結構由5個conv-bn-relu的convblock和5個 stride=2,kernel_size=2的pooling作為特征提取,對于訓練圖片w*h,其中w=1024,h=32.h方向Pooling到1,為了提升效果,加入了lstm對w方向實行語義監督,最后接4個deconv-bn-relu的deconvblock對w方向做特征 upsample,最后接2個輸出deconvblock,最后2個輸出層都得到1*1*1*1024 向量;
S2.Label生成:
設start橫坐標x1,end橫坐標x2,在這些x1,x2上置1,別的置0,為增加正樣本,左右padding=2,生成字符label:設start橫坐標x1,end橫坐標x2,文字寬度=x2-x1,文字中心=(x2+x1)/2,以文字中心向左右padding 文字寬度/4,置為1,其余置為0;
S3.Loss函數:
使用帶權重的binary_cross_entropy,公式如下:
Loss=alpha*y*log(f(x))+belta*(1-y)*log(1-f(x))。
與現有技術相比,本發明的有益效果如下:
本發明提出了一種基于深度學習的單字分割方法,可以接在文本行分割之后,實現單字分割,即插即用,方便魯棒并且實時使用,適用于復雜的場景文本。
附圖說明
附圖用來提供對本發明的進一步理解,并且構成說明書的一部分,與本發明的實施例一起用于解釋本發明,并不構成對本發明的限制。在附圖中:
圖1是本發明的網絡架構示意圖;
圖2是本發明的實施例示意圖之一;
圖3是本發明的實施例示意圖之二;
圖4是本發明的實施例示意圖之三;
圖5是本發明的實施例示意圖之四。
具體實施方式
以下結合附圖對本發明的優選實施例進行說明,應當理解,此處所描述的優選實施例僅用于說明和解釋本發明,并不用于限定本發明。
實施例1
本發明如圖1-5所示,本發明提供一種即插即用的單字分割器,具體包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天翼電子商務有限公司,未經天翼電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011387546.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種建筑用風能利用系統和方法
- 下一篇:無接收器裝置定位





