[發明專利]文字識別方法、裝置、設備及存儲介質在審
| 申請號: | 202111535285.5 | 申請日: | 2021-12-15 |
| 公開(公告)號: | CN114495132A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 文玉茹;盧道和;楊軍;程志峰;李勛棋;羅海灣;何勇彬;陳鑒鑌;胡仲臣;陳剛;周佳振;朱嘉偉;郭英亞;李興龍;周琪;熊思清 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06K9/62;G06N3/04;G06N3/08;G06V10/44;G06V10/774;G06V10/82 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 朱穎;劉芳 |
| 地址: | 518027 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 識別 方法 裝置 設備 存儲 介質 | ||
1.一種文字識別方法,其特征在于,包括:
獲取待處理圖像,所述待處理圖像攜帶一個或多個文字;
對所述待處理圖像進行特征提取,獲得所述待處理圖像對應的圖像特征;
根據所述圖像特征,獲得所述待處理圖像中多個不同尺度的文字框,并對所述多個不同尺度的文字框進行文字框回歸處理;
根據文字框回歸處理后的多個不同尺度的文字框,確定所述待處理圖像中所述一個或多個文字的位置,并基于所述一個或多個文字的位置,對所述待處理圖像進行文字識別。
2.根據權利要求1所述的方法,其特征在于,所述對所述待處理圖像進行特征提取,獲得所述待處理圖像對應的圖像特征,包括:
基于密集連接網絡,對所述待處理圖像進行特征提取,獲得所述待處理圖像對應的所述圖像特征,其中,所述密集連接網絡包括一個或多個密集塊,所述密集連接網絡中任意兩個密集塊之間都有直接的連接,每一密集塊的輸入都是前面所有密集塊輸出的并集。
3.根據權利要求2所述的方法,其特征在于,所述密集連接網絡還包括一個或多個過渡連接層,所述過渡連接層包括1×1卷積層,每一過渡連接層的輸入都是前面所有密集塊和過渡連接層輸出的并集;
所述基于密集連接網絡,對所述待處理圖像進行特征提取,獲得所述待處理圖像對應的所述圖像特征,包括:
基于所述一個或多個密集塊,以及所述一個或多個過渡連接層,對所述待處理圖像進行特征提取,獲得所述待處理圖像對應的所述圖像特征。
4.根據權利要求1至3中任一項所述的方法,其特征在于,所述根據所述圖像特征,獲得所述待處理圖像中多個不同尺度的文字框,并對所述多個不同尺度的文字框進行文字框回歸處理,包括:
根據所述圖像特征,獲得所述待處理圖像中多個不同尺度的文字框,并確定所述多個不同尺度的文字框的偏移數據;
基于所述偏移數據,對所述多個不同尺度的文字框進行文字框回歸處理。
5.根據權利要求4所述的方法,其特征在于,所述根據所述圖像特征,獲得所述待處理圖像中多個不同尺度的文字框,并確定所述多個不同尺度的文字框的偏移數據,包括:
對所述圖像特征進行下采樣處理,并對下采樣處理后的圖像特征進行下采樣和卷積處理;
將下采樣和卷積處理后的圖像特征作為新的所述下采樣處理后的圖像特征,重新執行所述對下采樣處理后的圖像特征進行下采樣和卷積處理的步驟,直至獲得所述待處理圖像中所述多個不同尺度的文字框,并確定所述多個不同尺度的文字框的偏移數據。
6.根據權利要求1至3中任一項所述的方法,其特征在于,所述根據文字框回歸處理后的多個不同尺度的文字框,確定所述待處理圖像中所述一個或多個文字的位置,包括:
根據所述文字框回歸處理后的多個不同尺度的文字框和預設得分模型,獲得所述文字框回歸處理后的多個不同尺度的文字框的得分,其中,所述預設得分模型用于根據多個不同尺度的文字框中得分最高的文字框與多個不同尺度的文字框的交集和并集的比值,確定多個不同尺度的文字框的得分;
根據所述文字框回歸處理后的多個不同尺度的文字框的得分,計算所述文字框回歸處理后的多個不同尺度的文字框的位置,并基于所述文字框回歸處理后的多個不同尺度的文字框的位置,確定所述待處理圖像中所述一個或多個文字的位置。
7.根據權利要求6所述的方法,其特征在于,所述根據所述文字框回歸處理后的多個不同尺度的文字框的得分,計算所述文字框回歸處理后的多個不同尺度的文字框的位置,包括:
計算所述文字框回歸處理后的多個不同尺度的文字框中得分最高的文字框與文字框回歸處理后的文字框i的交集和并集的比值,其中,所述文字框回歸處理后的文字框i為所述文字框回歸處理后的多個不同尺度的文字框中任意一個文字框,i=1,…,n,n為整數,n根據所述文字框回歸處理后的多個不同尺度的文字框的數目確定;
若計算的比值小于預設閾值,則根據所述文字框回歸處理后的文字框i的得分,計算所述文字框回歸處理后的文字框i的位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111535285.5/1.html,轉載請聲明來源鉆瓜專利網。





