[發明專利]字符識別中識別結果的校驗方法和裝置有效
| 申請號: | 201610641373.6 | 申請日: | 2016-08-05 |
| 公開(公告)號: | CN107688803B | 公開(公告)日: | 2020-04-03 |
| 發明(設計)人: | 韓盛;王紅法;周龍沙;宋輝 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 邢雪紅;喬彬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 結果 校驗 方法 裝置 | ||
本公開揭示了一種字符識別中識別結果的校驗方法和裝置。所述方法包括:通過字符識別輸出的識別結果構建待識別字符串的隱馬爾科夫鏈,所述識別結果包含待識別字符串中各字符的候選字符;根據所述隱馬爾科夫鏈和預訓練的狀態轉移矩陣求解所述識別結果輸出所述候選字符的最優路徑;根據所述最優路徑中的狀態轉移概率識別所述待識別字符串中的非中文字符;根據所述待識別字符串中的非中文字符進行所述識別結果校驗的反饋。通過此過程,將待識別字符串中存在的非中文字符識別出來,并且根據此進行識別結果校驗的反饋,由此將為字符識別提供了反饋機制,并有效區分待識別字符串中的中文字符和非中文字符,進而能夠有效避免識別結果中低級錯誤的存在。
技術領域
本公開涉及字符識別技術領域,特別涉及一種字符識別中識別結果的校驗方法和裝置。
背景技術
隨著計算機技術的發展,各種票據、報刊、書籍、文稿以及其它印刷品被通過掃描靠墻光學輸入方式實現紙質文字到圖像信息的轉化。在獲得圖像信息之后,將通過OCR識別來實現圖像信息到可使用的計算機文字的轉換。
OCR識別所涉及的一般處理過程包括:圖片信息預處理、版面分析、字符分割、單字符訓練、字符識別以及后處理。實際上是通過工程技術和數字手段分割出單字符,然后對單字符進行識別的過程。
具體的,通常會先對圖像信息進行平滑濾波和二值化等預處理,再根據二值化的連通域特性對版面進行分析,切割出不同的文字區域,同時分析出不同的文字區域,同時分析出不同文字行以及獨立文字塊;利用前期訓練的分類模型,對每個文字塊進行識別輸出評分最高的識別結果,該識別結果即可用于得出此圖像信息所對應的最終文字分析結果。
此一般性的處理流程雖然簡單易行,但是也存在著自身的局限性。一方面,缺少有效的反饋機制來校驗識別結果,進而在實際中往往會出現很多低級的錯誤;另一方面,對于圖像信息,即待識別字符串中存在的非中文字符,由于處理流程中過分倚重待識別字符串中單個字符的識別,故無法有效區分中文字符和非字符字符,進而易于使得識別結果中存在著很多低級錯誤。
發明內容
為了解決相關技術中存在的字符識別缺乏反饋機制以及由于無法有效區分中文字符和非中文字符而導致識別結果中低級錯誤的存在的技術問題,本公開提供了一種字符識別中識別結果的校驗方法和裝置。
一種字符識別中識別結果的校驗方法,包括:
通過字符識別輸出的識別結果構建待識別字符串的隱馬爾科夫鏈,所述識別結果包含待識別字符串中各字符的候選字符;
根據所述隱馬爾科夫鏈和預訓練的狀態轉移矩陣求解所述識別結果輸出所述候選字符的最優路徑;
根據所述最優路徑中的狀態轉移概率識別所述待識別字符串中的非中文字符;
根據所述待識別字符串中的非中文字符進行所述識別結果校驗的反饋。
一種字符識別中識別結果的校驗裝置,所述裝置包括:
隱馬爾科夫鏈構建模塊,用于通過字符識別輸出的識別結果構建待識別字符串的隱馬爾科夫鏈,所述識別結果包含待識別字符串中各字符的候選字符;
最優路徑求解模塊,用于根據所述隱馬爾科夫鏈和預訓練的狀態轉移矩陣求解所述識別結果輸出所述候選字符的最優路徑;
非中文字符識別模塊,用于根據所述路徑中的狀態轉移概率識別所述待識別字符串中的非中文字符;
反饋模塊,用于根據所述待識別字符串中的非中文字符進行所述識別結果校驗的反饋。
本公開的實施例提供的技術方案可以包括以下有益效果:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610641373.6/2.html,轉載請聲明來源鉆瓜專利網。





