[發明專利]字符識別方法、裝置、電子設備及計算機可讀存儲介質在審
| 申請號: | 202210039339.7 | 申請日: | 2022-01-13 |
| 公開(公告)號: | CN114612910A | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 楊愛東;王靜遠;宋勇;葉曉舟;歐陽曄 | 申請(專利權)人: | 亞信科技(中國)有限公司 |
| 主分類號: | G06V30/32 | 分類號: | G06V30/32;G06V30/19;G06K9/62 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧 |
| 地址: | 100193 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 方法 裝置 電子設備 計算機 可讀 存儲 介質 | ||
本申請實施例提供了一種字符識別方法、裝置、電子設備及計算機可讀存儲介質,涉及計算機技術領域。該方法包括:獲取對待識別圖像進行第一字符識別的第一識別結果,以及第一識別結果的第一置信度值;其中,第一字符識別包括對印刷體文本以及手寫體文本中的至少一種進行識別;然后獲取對第二識別結果進行第二字符識別的第三識別結果,以及第三識別結果的第二置信度值;進而確定待識別圖像中的文本內容。本申請實施例實現了直接對包含印刷體文本和手寫體文本的圖像進行混合識別,無需在識別之前進行圖像分類,并且基于置信度值對混合識別后的圖像做進一步識別,提高了對圖像中的字符進行識別的準確率。
技術領域
本申請涉及計算機技術領域,具體而言,本申請涉及一種字符識別方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
由于企業文檔數字化需要提取文檔中的文字信息,OCR(Optical CharacterRecognition,光學字符識別)技術已經成為了企業文檔數字化的首選。OCR技術可以檢測出圖像文檔中的字符位置并識別字符,但真實文檔中往往混雜著印刷體、手寫體、印章等多種字體,識別較為困難。
因此,出現了基于神經網絡進行字符識別的方式。例如,采用神經網絡對圖像文檔中的字符進行識別時,首先使用檢測模型獲取關鍵文本邊框位置,截取文本區域,接著使用神經網絡分類器對文本區域進行分類,即區分出多種字符類型,最后根據文本區域的字符類型,使用不同的識別模型進行字符識別。
然而,神經網絡分類器在對多種字體進行分類時可能會出現錯誤,導致在后續識別中繼續使用預測錯誤的識別模型來識別字符;并且,由于識別模型的訓練集類型不平衡,容易出現識別結果不準確的問題;例如,訓練集中存在大量印刷體樣本時,則在后續識別時,分類器更容易識別印刷體,從而干擾輸出。
發明內容
本申請實施例的目的旨在能解決對包含多種字體的圖像進行字符識別時,準確率較低的問題。
根據本申請實施例的一個方面,提供了一種字符識別方法,該方法包括:
獲取對待識別圖像進行第一字符識別的第一識別結果,以及第一識別結果的第一置信度值;其中,第一字符識別包括對印刷體文本以及手寫體文本中的至少一種進行識別;
獲取對第二識別結果進行第二字符識別的第三識別結果,以及第三識別結果的第二置信度值;其中,第二識別結果包括第一置信度值低于預設閾值的第一識別結果;第二字符識別包括對手寫體文本進行識別;
根據第一識別結果、第一置信度值、第三識別結果和第三置信度值,確定待識別圖像中的文本內容。
可選地,獲取對待識別圖像進行第一字符識別的第一識別結果,以及第一識別結果的第一置信度值,包括:
將待識別圖像輸入至第一處理器,根據第一處理器對待識別圖像進行第一字符識別,獲取第一識別結果和第一識別結果的第一置信度值;
獲取對第二識別結果進行第二字符識別的第三識別結果,以及第三識別結果的第二置信度值,包括:
將第二識別結果對應的待識別圖像輸入至第二處理器,根據第二處理器進行第二字符識別,獲取第三識別結果和第三識別結果的第二置信度值。
可選地,獲取對第二識別結果進行第二字符識別的第三識別結果,以及第三識別結果的第二置信度值之后,方法還包括:
將第三識別結果與預設字符庫中的字符串進行匹配,篩選出相匹配的第二置信度值最大的第三識別結果。
可選地,獲取對待識別圖像進行第一字符識別的第一識別結果,以及第一識別結果的第一置信度值之前,方法包括:
將待識別圖像縮放為預設尺寸,并對縮放后的待識別圖像的RGB值進行歸一化處理;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于亞信科技(中國)有限公司,未經亞信科技(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210039339.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種二維磁粒子成像方法
- 下一篇:一種阿拉伯膠改性瓷磚背膠及其制備方法





