[發明專利]文字校正的方法及裝置、存儲介質、處理器在審
| 申請號: | 201811474270.0 | 申請日: | 2018-12-04 |
| 公開(公告)號: | CN109583439A | 公開(公告)日: | 2019-04-05 |
| 發明(設計)人: | 聶鐳;沙露露;鄭權;張峰;聶穎 | 申請(專利權)人: | 龍馬智芯(珠海橫琴)科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/32;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 江舟;董文倩 |
| 地址: | 519000 廣東省珠*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 校正 目標文字 詞向量 目標處理 存儲介質 文字識別 自動校正 處理器 向量 空格 歸一化處理 技術效果 目標圖片 網絡獲取 去重 預設 | ||
本發明公開了一種文字校正的方法及裝置、存儲介質、處理器。其中,該文字校正方法包括:通過預設網絡獲取目標圖片中待校正的目標文字的詞向量,其中,每個詞向量對應一個待校正的目標文字;對詞向量進行目標處理,獲得處理后的詞向量,其中,目標處理包括以下至少之一:去空格處理、去重處理、歸一化處理;將處理后的詞向量對應的待校正的目標文字輸入到訓練好的模型中,得到校正后的目標文字,達到對詞向量進行目標處理,從而實現了在文字識別過程中可以自動校正文字的技術效果,進而解決了現有技術在文字識別過程中無法實現文字自動校正的技術問題。
技術領域
本發明涉及文字處理領域,具體而言,涉及一種文字校正的方法及裝置、存儲介質、處理器。
背景技術
隨著信息時代的快速發展,越來越多的企業,銀行以及政府機構在辦理各種業務的時候希望能夠自動錄入各種證件信息,不僅僅能夠節省大量人力成本,還能夠使辦公智能化,提高辦公效率。以身份證為例,現有的方法大多針對身份證進行圖像處理后針對切割后的單個字符進行識別,該方法中需要對圖像中的字符進行分割,分割過程中產生的誤差會對識別結果產生影響;另一種方法是端對端方法,針對身份證圖像中的文字進行直接識別,該方法中如果由于人為因素導致身份證圖像模糊也會導致識別過程中出現偏差。
現有技術中,通過的做法是:首先提取出文字區域,對字符進行分割,逐個進行識別,則識別效果和照片清晰度,傾斜度,背景光照等相關性較大。可見,現有方法存在由于圖像分割不準確帶來對圖像信息中的文字識別不準確的問題,且在識別文字過程中不能夠自動校正錯誤的問題。
針對現有技術在文字識別過程中無法實現文字自動校正的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種文字校正的方法及裝置、存儲介質、處理器,以至少解決現有技術在文字識別過程中無法實現文字自動校正的技術問題。
根據本發明實施例的一個方面,提供了一種文字校正的方法,包括:通過預設網絡獲取目標圖片中待校正的目標文字的詞向量,其中,每個所述詞向量對應一個待校正的目標文字;對所述詞向量進行目標處理,獲得處理后的詞向量,其中,所述目標處理包括以下至少之一:去空格處理、去重處理、歸一化處理;將處理后的詞向量對應的待校正的目標文字輸入到訓練好的模型中,得到校正后的目標文字。
進一步地,對所述詞向量進行歸一化處理包括:基于預設條件對所述詞向量進行概率值歸零處理。
進一步地,通過預設網絡獲取目標圖片中待校正的目標文字的詞向量包括:通過卷積神經網絡獲取所述目標圖片的特征矩陣,其中,所述目標圖片包括所述待校正的目標文字;將所述特征矩陣輸入長短期記憶網絡獲取所述目標圖片中待校正的目標文字的詞向量。
進一步地,通過第一預設網絡獲取所述目標圖片的特征矩陣之前,所述方法包括:通過模板對所述目標標圖進行預處理;對預處理后的所述目標標圖進行縮放,獲得所述目標圖片,其中,對預處理后的所述目標圖像進行縮放時保持所述目標圖片的寬度不變。
根據本發明實施例的另一方面,還提供了一種文字校正的裝置,包括:第一獲取單元,用于通過預設網絡獲取目標圖片中待校正的目標文字的詞向量,其中,每個所述詞向量對應一個待校正的目標文字;第二獲取單元,用于對所述詞向量進行目標處理,獲得處理后的詞向量,其中,所述目標處理包括以下至少之一:去空格處理、去重處理、歸一化處理;校正單元,用于將處理后的詞向量對應的待校正的目標文字輸入到訓練好的模型中,得到校正后的目標文字。
進一步地,對所述詞向量進行歸一化處理包括:基于預設條件對所述詞向量進行概率值歸零處理。
進一步地,所述第一獲取單元包括:第一獲取模塊,用于通過卷積神經網絡獲取所述目標圖片的特征矩陣,其中,所述目標圖片包括所述待校正的目標文字;第二獲取模塊,用于將所述特征矩陣輸入長短期記憶網絡獲取所述目標圖片中待校正的目標文字的詞向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于龍馬智芯(珠海橫琴)科技有限公司,未經龍馬智芯(珠海橫琴)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811474270.0/2.html,轉載請聲明來源鉆瓜專利網。





