[發明專利]一種文字圖像識別糾錯方法和電子設備有效
| 申請號: | 202210316087.8 | 申請日: | 2022-03-29 |
| 公開(公告)號: | CN114677689B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 宋祺;張睿;燕鵬舉;周健 | 申請(專利權)人: | 上海弘璣信息技術有限公司 |
| 主分類號: | G06V30/40 | 分類號: | G06V30/40;G06F40/216;G06F40/232 |
| 代理公司: | 江蘇瑞途律師事務所 32346 | 代理人: | 計璐 |
| 地址: | 200000 上海市閔*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 圖像 識別 糾錯 方法 電子設備 | ||
本發明公開一種文字圖像識別糾錯方法和電子設備,屬于計算機視覺和自然語言處理技術領域。針對現有技術中存在的文字圖像識別準確率不夠,構建模型需要成本較高的問題,本發明對文字圖像識別后的潛在錯誤結果構建候選替換集合,基于語言模型替換潛在錯誤結果,對替換后的每個文字序列計算合理性得分,根據得分排序,輸出得分合理性得分最高的文字序列作為糾錯后輸出結果。本發明基于語言模型進行文字圖像識別的糾錯,提高文字圖像識別的準確性,且成本低耗費時間少,不受模塊中其他單元限制,通用性強,適合廣泛應用。
技術領域
本發明涉及計算機視覺和自然語言處理技術領域,更具體地說,涉及一種文字圖像識別糾錯方法和電子設備。
背景技術
文字圖像,即包括文字信息的圖像。目前,識別圖像中的文字作為計算機視覺中的一種常用技術,被廣泛應用于文檔信息提取、證照識別、資質審核等實際項目中,特別是在RPA?(Robotic?Process?Automation,機器人流程自動化)項目中有著普遍應用。在研發過程中,文字圖像識別算法通常使用海量數據訓練,得到一個在測試集上效果比較理想的模型。但在某些實際使用場景,往往會出現測試集中沒有出現的數據,文字圖像識別算法的準確率會因此打折。
識別圖像中文字時,由于圖像中文字大小、形狀、顏色等表達的多樣性,往往會產生錯誤的識別結果,因此現文字圖像識別中均包括糾錯步驟。現有技術的糾錯方式主要是在訓練文字識別模型階段進行優化,如收集更多的實際使用場景數據加入到模型訓練,或為一些非常重要的場景單獨訓練一個文字圖像識別模型,用于克服識別過程中的糾錯,但是,現有技術尚有以下不足:
1、某些場景的數據比較難收集,例如醫療、金融和保險等領域的相關文檔,由于用戶隱私問題,無法將所有的數據均公開給乙方作為訓練數據;
2、標注文字識別數據需要消耗大量資金和時間;一般來說,標注二十萬的數據大約需要十萬元,耗時至少兩個月,而一個效果較好的文字圖像識別模型通常需要千萬量級的數據;
3、文字圖像識別模型的迭代需要耗費大量的人力、算力和時間;一般來說,利用千萬數據量級訓練一個文字圖像識別模型通常需要一周左右的時間;
4、單獨訓練一個文字圖像識別模型用于某些特殊場景缺乏普適性,文字圖像識別的實際應用場景存在成千上萬個,但由于人力、算力和時間限制,為每個場景單獨訓練一個模型基本沒有可行性。
發明內容
1.要解決的技術問題
針對現有技術中存在的文字圖像識別準確率不夠,構建模型需要成本較高的問題,本發明提供一種文字圖像識別糾錯方法和電子設備,基于語言模型進行文字圖像識別的糾錯,提高文字圖像識別的準確性,且成本低,耗費時間少,應用時不受模塊中其他單元限制,通用性強,適合廣泛應用。
2.技術方案
本發明的目的通過以下技術方案實現。
第一方面,本發明提供一種文字圖像識別糾錯方法,包括以下步驟:
對文字圖像進行文字識別,預處理文字識別結果,過濾出所述文字識別結果的潛在錯誤結果;
構建候選替換集合;候選替換集合可以是包括所有漢字的集合,或者1000個常用漢字的集合,或者是GBK/2、GBK/3漢字編碼集合,GBK/2漢字編碼集合收錄6763個漢字,GBK/3?漢字編碼集合收錄6080個漢字;
基于語言模型,用所述候選替換集合中的文字逐一替換所述潛在錯誤結果,并計算每次潛在錯誤結果替換后文字序列的合理性得分;
將所有合理性得分排序,輸出合理性得分最高的文字序列作為糾錯后輸出結果。
更進一步的,對于包括多個所述潛在錯誤結果的文字識別結果,結合所有所述潛在錯誤結果替換后的文字序列計算合理性得分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海弘璣信息技術有限公司,未經上海弘璣信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210316087.8/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





