[發明專利]字符識別方法、字符譯碼模型的訓練方法及電子設備有效
| 申請號: | 202010591459.9 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111738248B | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 蔡嘯;晉兆龍;肖瀟 | 申請(專利權)人: | 蘇州科達科技股份有限公司 |
| 主分類號: | G06V30/10 | 分類號: | G06V30/10;G06V30/18;G06V30/19;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司 11250 | 代理人: | 張琳琳 |
| 地址: | 215011 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 方法 譯碼 模型 訓練 電子設備 | ||
本發明涉及圖像處理技術領域,具體涉及字符識別方法、字符譯碼模型的訓練方法及電子設備,識別方法包括獲取目標字符圖像以及預設字典;所述預設字典中包括多個預設詞組;將目標字符圖像輸入字符譯碼模型中,以使得所述字符譯碼模型利用所述預設字典輸出字符序列;基于多個預設詞組,依次對字符序列中預設長度的連續字符進行詞組驗證,以得到目標字符序列。在對目標字符圖像進行字符譯碼輸出字符序列之后,再基于預設字典對字符序列中的連續字符進行詞組驗證,對字符序列中的詞組進行適應性調整,以保證字符序列中的由字符組成的詞組的準確性,從而提高整個目標字符序列的準確性。
技術領域
本發明涉及圖像處理技術領域,具體涉及字符識別方法、字符譯碼模型的訓練方法及電子設備。
背景技術
字符識別(Optical Character Recognition,簡稱為OCR)是計算機視覺研究領域的分支之一,是一種利用計算機技術把圖片上的文字讀取出來并轉換成字符信息的技術。傳統的字符識別流程包括版面分析、圖像預處理、字符切割、字符識別、后處理識別矯正等步驟。然而此類方法有兩個缺點,一是匹配特征需要人工設計,它們在字體變化,模糊或背景干擾時泛化能力迅速下降。二是傳統流程過度依賴字符切分的結果,在字符扭曲、粘連、噪聲干擾的情況下,錯誤傳播現象尤其突出。
隨著深度神經網絡的迅速崛起,其給OCR技術帶來了遍歷。在字符識別技術中一個普遍被采用的結構為CTPN結構,即,CNN特征提取+BLSTM上下文聯系+CTC譯碼的結構,其中,神經網絡主要充當特征提取器和分類器的功能,輸入是圖像,輸出字符序列的整體識別結果。然而,發明人在對該CTPN結構進行研究過程中發現,該結構是雖然在譯碼之前經過了上下文聯系的處理,但是由于單個字符可以組成若干個詞組,若僅僅對其進行上下文聯系的處理,最終經過CTC譯碼得到的字符序列中仍會存在詞組錯誤,導致字符識別的準確率偏低。
發明內容
有鑒于此,本發明實施例提供了一種字符識別方法、字符譯碼模型的訓練方法及電子設備,以解決字符識別準確率低的問題。
根據第一方面,本發明實施例提供了一種字符識別方法,包括:
獲取目標字符圖像以及預設字典;其中,所述預設字典中包括多個預設詞組;
將所述目標字符圖像輸入字符譯碼模型中,以使得所述字符譯碼模型利用所述預設字典輸出字符序列;
基于所述多個預設詞組,依次對所述字符序列中預設長度的連續字符進行詞組驗證,以得到目標字符序列。
本發明實施例提供的字符識別方法,在對目標字符圖像進行字符譯碼輸出字符序列之后,再基于預設字典對字符序列中的連續字符進行詞組驗證,對字符序列中的詞組進行適應性調整,以保證字符序列中的由字符組成的詞組的準確性,從而提高整個目標字符序列的準確性。
結合第一方面,在第一方面第一實施方式中,所述字符譯碼模型的輸出還包括所述字符序列中各個字符對應于所述預設字典中各個字符的概率;其中,所述基于所述多個預設詞組,依次對所述字符序列中預設長度的連續字符進行詞組驗證,以得到目標字符序列,包括:
提取所述預設詞典中以所述預設長度的連續字符中的第一字符開始且長度為所述預設長度的詞組;
利用所述字符序列中各個字符對應于所述預設字典中各個字符的概率,計算所述字符序列中所述預設長度的連續字符的第一聯合后驗概率值以及各個所述預設長度的詞組的第二聯合后驗概率值;
基于所述第一聯合后驗概率值以及所有所述第二聯合后驗概率值,確定所述預設長度的連續字符對應的目標詞組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州科達科技股份有限公司,未經蘇州科達科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010591459.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鋼結構支架
- 下一篇:激光通信終端收發同軸實時校準方法





