[發明專利]文本識別方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011135016.5 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112215236A | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 盧青;章繼東 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/62;G06F40/216;G06F40/126 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 識別 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提供一種文本識別方法、裝置、電子設備及存儲介質,所述方法包括:預測待識別對象的字符數量;對待識別對象進行文本識別,并統計文本識別所得的字符數量;當預測所得的字符數量與統計所得的字符數量匹配時,輸出待識別對象的文本識別結果。本發明實施例提供的文本識別方法、裝置、電子設備及存儲介質,保證了文本識別結果的完整性,提高了文本識別的準確性。
技術領域
本發明涉及圖像處理技術領域,尤其涉及一種文本識別方法、裝置、電子設備及存儲介質。
背景技術
隨著人工智能技術的快速發展,文本識別廣泛應用于智能教育、智能辦公和智能物流等諸多領域。
現有的文本識別方法主要包括基于傳統分割方法的文本識別方法和基于深度學習的文本識別方法。然而,對于一些包含較大空隙的文本,例如試卷中的填空題和選擇題,現有的文本識別方法存在對空隙之后的文本漏識別的問題,其準確性欠佳。
發明內容
本發明實施例提供一種文本識別方法、裝置、電子設備及存儲介質,用以解決現有技術中存在漏識別、準確性較低的缺陷。
本發明實施例提供一種文本識別方法,包括:
預測待識別對象的字符數量;
對所述待識別對象進行文本識別,并統計所述文本識別所得的字符數量;
當預測所得的字符數量與統計所得的字符數量匹配時,輸出所述待識別對象的文本識別結果。
根據本發明一個實施例的文本識別方法,還包括:
當所述預測所得的字符數量和所述統計所得的字符數量不匹配時,對所述待識別對象進行分塊,得到多個對象子塊;
對每個對象子塊分別進行文本識別,將所述文本識別所得的每個對象子塊的文本進行組合,并統計所述組合所得的字符數量。
根據本發明一個實施例的文本識別方法,所述對所述待識別對象進行分塊,包括:
計算所述待識別對象中相鄰字符之間的間距,以位于間距最大的相鄰字符之間的分割線對所述待識別對象進行分塊。
根據本發明一個實施例的文本識別方法,所述對所述待識別對象進行文本識別包括:
應用文本識別模型,獲取所述待識別對象的文本識別結果;
其中,所述文本識別模型用于基于所述待識別對象中各個字符的上下文關系進行文本識別。
根據本發明一個實施例的文本識別方法,所述應用文本識別模型,獲取所述待識別對象的文本識別結果,包括:
應用所述文本識別模型的對象特征編碼層,獲取所述待識別對象中每一區域的對象特征編碼;
應用所述文本識別模型的上下文編碼層,獲取對應于每一區域的對像特征編碼以及上一解碼時刻的解碼狀態的當前解碼時刻的對象上下文編碼;
應用所述文本識別模型的解碼層,獲取對應于當前解碼時刻的解碼狀態和對象上下文編碼,以及上一解碼時刻的解碼結果的當前解碼時刻的解碼結果;
其中,所述當前解碼時刻的解碼狀態是基于當前解碼時刻的對象上下文編碼,以及上一解碼時刻的解碼狀態和解碼結果確定的;
所述文本識別結果為最終解碼時刻的解碼結果。
根據本發明一個實施例的文本識別方法,所述應用所述文本識別模型的上下文編碼層,獲取對應于每一區域的對像特征編碼以及上一解碼時刻的解碼狀態的當前解碼時刻的對象上下文編碼,包括:
應用所述上下文編碼層的注意力權重確定層,獲取對應于每一區域的對像特征編碼以及上一解碼時刻的解碼狀態的每一區域對應的對象特征編碼的注意力權重;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011135016.5/2.html,轉載請聲明來源鉆瓜專利網。





