[發明專利]一種文字識別方法、裝置、電子設備及存儲介質在審

申請號：	202010172679.8	申請日：	2020-03-12
公開（公告）號：	CN111428593A	公開（公告）日：	2020-07-17
發明（設計）人：	宋祺;姜仟藝;劉曦;張睿	申請（專利權）人：	北京三快在線科技有限公司
主分類號：	G06K9/00	分類號：	G06K9/00;G06K9/62;G06N3/04
代理公司：	北京市隆安律師事務所 11323	代理人：	權鮮枝
地址：	100190 北京市海***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種文字識別方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了一種文字識別方法、裝置、電子設備及存儲介質，該方法包括：對目標圖像進行紋理特征編碼，生成第一特征序列；對第一特征序列進行解碼，得到第一識別結果；基于遞歸神經網絡對第一特征序列進行上下文互信息編碼，生成第二特征序列；對第二特征序列進行解碼，得到第二識別結果；根據第一識別結果和第二識別結果聯合確定文字識別結果。本申請的有益效果在于，將文字本身特征與上下文互信息相結合，顯著提高文字識別的準確率，且計算量小、計算速度快、可用性強。

技術領域

本申請涉及數據處理技術領域，具體涉及一種文字識別方法、裝置、電子設備及存儲介質。

背景技術

文字識別作為計算機視覺中的一種常用技術，被廣泛應用于文檔分析、證照識別、街景識別、資質審核、自動錄入等場景中，為人們的日常生活和工作提供了很大的便利。但是現有技術依然存在著很多不足之處，如某些文字識別方法僅考慮到了字符本身的特征，忽略了字符之間的上下文語義特征，在某些字符由于光照、污漬等產生遮擋難以識別時，無法基于其它字符內容進行上下文聯合推斷識別。而某些文字識別方法又過于依賴上下文信息，導致極其容易混淆相似文字，例如，如果數據中“麥當勞”出現的次數遠多于“麥肯基”，那么所有的“麥肯基”都可能被識別為“麥當勞”。

發明內容

鑒于上述問題，提出了本申請以便提供一種克服上述問題或者至少部分地解決上述問題的一種文字識別方法、裝置、電子設備及存儲介質。

依據本申請的一個方面，提供了一種文字識別方法，該方法包括：

對目標圖像進行紋理特征編碼，生成第一特征序列；

對第一特征序列進行解碼，得到第一識別結果；

基于遞歸神經網絡對第一特征序列進行上下文互信息編碼，生成第二特征序列；

對第二特征序列進行解碼，得到第二識別結果；

根據第一識別結果和第二識別結果聯合確定文字識別結果。

可選的，在上述方法中，對用于文字識別的圖像進行紋理特征編碼，生成第一特征序列包括：

根據卷積神經網絡對目標圖像進行特征提取，得到目標圖像的圖像特征；

對圖像特征進行注意力處理，確定目標圖像中文字前景的掩模；

將掩模與圖像特征進行融合，得到第一特征序列。