[發明專利]印章文本定位方法、裝置及電子設備在審
| 申請號: | 202010621366.6 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111950356A | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 高亞南 | 申請(專利權)人: | 深圳市雄帝科技股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06T7/73;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 印章 文本 定位 方法 裝置 電子設備 | ||
本公開實施例提供一種印章文本定位方法、裝置及電子設備,屬于圖像處理技術領域。其中方法包括:接收待識別的印章圖片;將所述印章圖片輸入訓練好的文本區域定位模型,獲得所述印章圖片中文本區域的位點參數,其中,所述位點參數至少包括所述文本區域的頂點像素、頭尾像素和邊界像素中的至少一種;根據所述文本區域的位點參數,在所述印章圖片中定位所述文本區域。本公開實施提供的方案,通過訓練好的文本區域定位模型自動、準確地在待識別的印章圖片中定位出文本區域,提高了印章圖片中文本區域的識別效率和準確率。
技術領域
本公開涉及圖像處理技術領域,尤其涉及一種印章文本定位方法、裝置及電子設備。
背景技術
目前沒有針對護照印章的文本檢測技術,現有復雜場景下的文本檢測,網絡輸入層圖片較大,網絡結構過于復雜,而護照的單個印章圖片比較小,印章文本的背景相對簡單,現有復雜場景下的文本檢測速度比較慢,不具有可用性。現有的身份證文本檢測技術是通過模板中固定元素的位置來實現定位的,而在印章變形、旋轉、模糊、缺失的情況下,使用模板匹配來檢測文本,準確率不高。
可見,現有的印章文本識別方案存在文本區域定位的準確率較低的技術問題。
發明內容
有鑒于此,本公開實施例提供一種印章文本定位方法、裝置及電子設備,至少部分解決現有技術中存在的問題。
第一方面,本公開實施例提供了一種印章文本定位方法,包括:
接收待識別的印章圖片;
將所述印章圖片輸入訓練好的文本區域定位模型,獲得所述印章圖片中文本區域的位點參數,其中,所述位點參數至少包括所述文本區域的頂點像素、頭尾像素和邊界像素中的至少一種;
根據所述文本區域的位點參數,在所述印章圖片中定位所述文本區域。
根據本公開實施例的一種具體實現方式,所述將所述印章圖片輸入訓練好的文本區域定位模型,獲得所述印章圖片中文本區域的位點參數的步驟,包括:
將所述印章圖片輸入所述文本區域定位模型,其中,所述文本區域定位模型包括第一卷積塊、第二卷積塊和第三卷積塊;
通過所述第一卷積塊、第二卷積塊和第三卷積塊之間自頂向下進行的多層特征融合作用,得到第一輸出分支、第二輸出分支和第三輸出分支;
根據所述第一輸出分支識別所述印章圖片中位于所述文本區域的邊界框內的邊界像素,根據所述第二輸出分支識別位于所述文本區域的頭部和/或尾部的頭尾像素,以及,根據所述第三輸出分支識別位于所述文本區域的頂點位置的頂點像素。
根據本公開實施例的一種具體實現方式,所述印章圖片為正方形圖片,所述印章圖片的單邊尺寸范圍為256至400,所述第一卷積塊的通道數為32,第二卷積塊的通道數為64,第三卷積塊的通道數為128;
所述通過所述第一卷積塊、第二卷積塊和第三卷積塊之間自頂向下進行的多層特征融合作用,得到第一輸出分支、第二輸出分支和第三輸出分支的步驟,包括:
通過所述第一卷積塊對所述印章圖片進行卷積處理,得到維度為128*128*32的第一特征圖;
通過所述第二卷積塊對所述第一特征圖進行卷積處理,得到維度為64*64*64的第二特征圖;
通過所述第三卷積塊對所述第二特征圖進行卷積處理,得到維度為32*32*128的第三特征圖;
將所述第三特征圖進行上采樣處理,得到維度為64*64*128的第四特征圖;
將所述第四特征圖和所述第二特征圖進行通道合并,得到維度為64*64*192的第五特征圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市雄帝科技股份有限公司,未經深圳市雄帝科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010621366.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:印章識別方法、裝置及電子設備
- 下一篇:一種沙棘分離制油方法及其制得的油





