[發明專利]文本識別方法、裝置、電子設備及存儲介質在審

申請號：	202011135016.5	申請日：	2020-10-21
公開（公告）號：	CN112215236A	公開（公告）日：	2021-01-12
發明（設計）人：	盧青;章繼東	申請（專利權）人：	科大訊飛股份有限公司
主分類號：	G06K9/34	分類號：	G06K9/34;G06K9/62;G06F40/216;G06F40/126
代理公司：	北京路浩知識產權代理有限公司 11002	代理人：	程琛
地址：	230088 安徽省***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	文本識別方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例提供一種文本識別方法、裝置、電子設備及存儲介質，所述方法包括：預測待識別對象的字符數量；對待識別對象進行文本識別，并統計文本識別所得的字符數量；當預測所得的字符數量與統計所得的字符數量匹配時，輸出待識別對象的文本識別結果。本發明實施例提供的文本識別方法、裝置、電子設備及存儲介質，保證了文本識別結果的完整性，提高了文本識別的準確性。

技術領域

本發明涉及圖像處理技術領域，尤其涉及一種文本識別方法、裝置、電子設備及存儲介質。

背景技術

隨著人工智能技術的快速發展，文本識別廣泛應用于智能教育、智能辦公和智能物流等諸多領域。

現有的文本識別方法主要包括基于傳統分割方法的文本識別方法和基于深度學習的文本識別方法。然而，對于一些包含較大空隙的文本，例如試卷中的填空題和選擇題，現有的文本識別方法存在對空隙之后的文本漏識別的問題，其準確性欠佳。

發明內容

本發明實施例提供一種文本識別方法、裝置、電子設備及存儲介質，用以解決現有技術中存在漏識別、準確性較低的缺陷。

本發明實施例提供一種文本識別方法，包括：

預測待識別對象的字符數量；

對所述待識別對象進行文本識別，并統計所述文本識別所得的字符數量；

當預測所得的字符數量與統計所得的字符數量匹配時，輸出所述待識別對象的文本識別結果。

根據本發明一個實施例的文本識別方法，還包括：

當所述預測所得的字符數量和所述統計所得的字符數量不匹配時，對所述待識別對象進行分塊，得到多個對象子塊；

對每個對象子塊分別進行文本識別，將所述文本識別所得的每個對象子塊的文本進行組合，并統計所述組合所得的字符數量。

根據本發明一個實施例的文本識別方法，所述對所述待識別對象進行分塊，包括：

計算所述待識別對象中相鄰字符之間的間距，以位于間距最大的相鄰字符之間的分割線對所述待識別對象進行分塊。

根據本發明一個實施例的文本識別方法，所述對所述待識別對象進行文本識別包括：

應用文本識別模型，獲取所述待識別對象的文本識別結果；

其中，所述文本識別模型用于基于所述待識別對象中各個字符的上下文關系進行文本識別。

根據本發明一個實施例的文本識別方法，所述應用文本識別模型，獲取所述待識別對象的文本識別結果，包括：

應用所述文本識別模型的對象特征編碼層，獲取所述待識別對象中每一區域的對象特征編碼；

應用所述文本識別模型的上下文編碼層，獲取對應于每一區域的對像特征編碼以及上一解碼時刻的解碼狀態的當前解碼時刻的對象上下文編碼；

應用所述文本識別模型的解碼層，獲取對應于當前解碼時刻的解碼狀態和對象上下文編碼，以及上一解碼時刻的解碼結果的當前解碼時刻的解碼結果；

其中，所述當前解碼時刻的解碼狀態是基于當前解碼時刻的對象上下文編碼，以及上一解碼時刻的解碼狀態和解碼結果確定的；

所述文本識別結果為最終解碼時刻的解碼結果。

根據本發明一個實施例的文本識別方法，所述應用所述文本識別模型的上下文編碼層，獲取對應于每一區域的對像特征編碼以及上一解碼時刻的解碼狀態的當前解碼時刻的對象上下文編碼，包括：

應用所述上下文編碼層的注意力權重確定層，獲取對應于每一區域的對像特征編碼以及上一解碼時刻的解碼狀態的每一區域對應的對象特征編碼的注意力權重；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司，未經科大訊飛股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011135016.5/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：甘蔗SPSB基因同等型2的鑒定及應用
下一篇：鏡像部署方法、裝置、設備及存儲介質

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06K 數據識別；數據表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復掃描圖形的方法
G06K9-18 .應用具有附加代碼標記或含有代碼標記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預處理，即無須判定關于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】