[發明專利]一種字符識別方法、裝置及電子設備有效
| 申請號: | 201910368528.7 | 申請日: | 2019-05-05 |
| 公開(公告)號: | CN111898623B | 公開(公告)日: | 2023-09-05 |
| 發明(設計)人: | 翟金源 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 李欣;丁蕓 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符 識別 方法 裝置 電子設備 | ||
1.一種字符識別方法,其特征在于,所述方法包括:
對待識別圖像進行字符識別,得到所述待識別圖像中各字符的多個候選值;
將預測字符串與預設的字符模板進行匹配,確定所述預測字符串與所述字符模板不匹配的位置,作為待編輯位置,所述預測字符串為所述待識別圖像中各字符的置信度最高的候選值組成的字符串,所述字符模板用于表示所述待識別圖像中包含的每個字符的取值范圍;
從所述待編輯位置對應的字符的候選值中,選擇與所述字符模板中所述待編輯位置匹配的字符,作為參考字符;
利用所述參考字符,對所述預測字符串的所述待編輯位置進行編輯,得到所述待識別圖像的字符識別結果。
2.根據權利要求1所述的方法,其特征在于,所述將預測字符串與預設的字符模板進行匹配,確定所述預測字符串與所述字符模板不匹配的位置,作為待編輯位置,包括:
基于預測字符串和預設的字符模板構建編輯距離表,所述編輯距離表中的第i行第j列的值用于表示,所述預測字符串中第一個字符開始至第j個字符組成的字符子串與所述字符模板中第一個取值范圍至第i個取值范圍組成的字符子模板之間的編輯距離,所述編輯距離用于表示將字符串編輯至與字符模板完全匹配所需要的最少編輯次數,i為取值范圍在1到所述預測字符串的長度的正整數,j為取值范圍在1到所述字符模板的長度的正整數;
沿著編輯距離最小的方向,確定從所述編輯距離表中最后一行最后一列開始,至所述編輯距離表中第一行第一列的回溯路徑;
將所述回溯路徑中滿足以下任一條件的位置確定為待編輯位置:所述回溯路徑在該位置處的方向為水平方向,所述回溯路徑在該位置處的方向為垂直方向,所述回溯路徑在該位置處的方向為斜邊方向并且該位置的編輯距離大于所述回溯路徑中相鄰的下一個位置的編輯距離。
3.根據權利要求2所述的方法,其特征在于,所述從所述待編輯位置對應的字符的候選值中,選擇與所述字符模板中所述待編輯位置匹配的字符,作為參考字符,包括:
如果所述待編輯位置滿足條件:所述回溯路徑在該位置處的方向為垂直方向,所述回溯路徑在該位置處的方向為斜邊方向并且該位置的編輯距離大于所述回溯路徑中相鄰的下一個位置的編輯距離,從所述待編輯位置對應的字符的候選值中,選擇與所述字符模板中所述待編輯位置匹配的字符,作為參考字符;
所述方法還包括:
如果所述待編輯位置滿足條件:所述回溯路徑在該位置處的方向為水平方向,刪除所述預測字符串中所述待編輯位置的字符,得到所述待識別圖像的字符識別結果。
4.根據權利要求1所述的方法,其特征在于,所述對待識別圖像進行字符識別,得到所述待識別圖像中各字符的多個候選值,包括:
將所述待識別圖像輸入至預設的字符識別模型,得到所述字符識別模型輸出的所述待識別圖像中各字符的多個候選值,所述字符識別模型包括卷積神經網絡、循環神經網絡、編碼器以及解碼器,其中,所述卷積神經網絡用于提取輸入的待識別圖像的圖像特征,并將提取到的圖像特征輸入至所述循環神經網絡,所述循環神經網絡用于對輸入的圖像特征進行上下文建模,并將經過上下文建模的圖像特征輸入至所述編碼器,所述編碼器用于對輸入的圖像特征進行編碼,并將編碼后的圖像特征輸入至所述解碼器,所述解碼器用于基于輸入的圖像特征,確定輸入所述字符識別模型的圖像中各字符的多個候選值。
5.根據權利要求4所述的方法,其特征在于,所述方法還包括:
基于所述預測字符串與所述字符模板的匹配程度,確定所述預測字符串的準確率,作為第一準確率;
如果所述第一準確率低于預設第一準確率閾值,對所述字符識別模型進行在線訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910368528.7/1.html,轉載請聲明來源鉆瓜專利網。





