[發明專利]一種基于神經網絡的OCR識別方法及設備在審
| 申請號: | 202011387854.1 | 申請日: | 2020-12-02 |
| 公開(公告)號: | CN112508011A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 陸大海 | 申請(專利權)人: | 上海逸舟信息科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201100 上海市閔行區閔虹路16*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 ocr 識別 方法 設備 | ||
1.一種基于神經網絡的OCR識別方法,其特征在于,包括:
步驟一:獲取業務方提供的待識別數據,把待識別數據轉換為待識別圖像;
步驟二:利用角度分類器對待識別圖像進行文本方向檢測,對文本圖像進行校正處理;
步驟三:使用文本檢測模型檢測校正后的圖像,得到目標文本框坐標和文本檢測置信度;
步驟四:通過輸入文本框坐標獲取圖像的透視變換矩陣,對圖像進行剪裁和透視變換,獲取分割子圖像;
步驟五:利用文本識別模型對分割子圖像進行識別,得到文本數據和文本識別置信度;
步驟六:根據第三步和第五步的文本框坐標和對應的文本數據,進行坐標排序,得到有序文本;
步驟七:對有序文本進行模糊匹配,得到模板關鍵詞,通過對應模板對有序文本進行信息提取,最終得到結構化數據。
2.根據權利要求1所述的一種基于神經網絡的OCR識別方法,其特征在于,所述步驟一中包含數據解析模塊,所述數據解析模塊將待識別數據轉化為待識別圖像。
3.根據權利要求1所述的一種基于神經網絡的OCR識別方法,其特征在于,所述步驟二的角度分類器檢測角度包括0°,90°,180°和270°。
4.根據權利要求1所述的一種基于神經網絡的OCR識別方法,其特征在于,所述步驟三包括對圖像處理后得到概率圖和閾值圖,并對所述概率圖和閾值圖進行組合優化,進而得到可以自適應的二值圖。
5.根據權利要求1所述的一種基于神經網絡的OCR識別方法,其特征在于,所述步驟五包括提取圖像的卷積特征,通過深層雙向循環神經網絡(LSTM)進一步提取卷積特征中的序列特征,最后引入CTC損失函數進行優化。
6.根據權利要求1所述的一種基于神經網絡的OCR識別方法,其特征在于,所述步驟六中的坐標排序包括:
根據文本框的高度以及文本框矩形中心點縱坐標進行縱向排序,再根據中心點橫坐標進行橫向排序,得到有序文本。
7.根據權利要求1所述的一種基于神經網絡的OCR識別方法,其特征在于,所述步驟七中的模板是基于業務方提供樣本的布局屬性設計的。
8.一種電子設備,其特征在于,包括:
處理器和存儲器;
所述存儲器存儲所述處理器的可執行指令;
其中,所述處理器可加載并執行如權利要求1-7任一項所述的基于神經網絡的OCR識別方法。
9.一種計算機可讀存儲介質,其特征在于,所述存儲介質中存儲多條指令;所述指令由處理器加載并執行如權利要求1-7任一項所述的基于神經網絡的OCR識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海逸舟信息科技有限公司,未經上海逸舟信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011387854.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:插座、連接器及電子設備
- 下一篇:一種自動點焊機





