[發明專利]一種文本識別方法、裝置、可讀存儲介質及計算設備有效
| 申請號: | 202110581348.4 | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113052162B | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 劉軍;秦勇 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京鼎承知識產權代理有限公司 11551 | 代理人: | 顧可嘉;夏華棟 |
| 地址: | 100872 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 識別 方法 裝置 可讀 存儲 介質 計算 設備 | ||
本發明實施例提供了一種文本識別方法、裝置、可讀存儲介質及計算設備,通過多個特征提取網絡的特征互操作處理,增強了密集文本檢測效果。方法包括:獲取原始文本圖像;將原始文本圖像按照預設順序輸入多個特征提取網絡,分別獲取多個特征提取網絡的輸出特征;其中,特征提取網絡包括多個殘差塊,對于任意的符合預設順序的相鄰的第一特征提取網絡和第二特征提取網絡,第二特征提取網絡的輸出特征是根據第二特征提取網絡中每個殘差塊的原始輸出特征以及第一特征提取網絡中最后一個殘差塊的輸出特征獲得的;根據多個特征提取網絡的輸出特征,分別得到原始文本圖像的多組文本識別結果;合并原始文本圖像的多組文本識別結果,得到最終的文本識別結果。
技術領域
本發明涉及計算機神經網絡技術領域,尤其涉及一種文本識別方法、裝置、可讀存儲介質及計算設備。
背景技術
文本檢測應用范圍廣泛,是很多計算機視覺任務的前置步驟,比如圖像搜索、文字識別,身份認證和視覺導航等,文本檢測的主要目的是定位文本行或字符在圖像中的位置。文本的精準定位既十分重要又具備挑戰,因為相較于通用目標檢測來說,文字具有多方向、不規則形狀、極端長寬比、字體、顏色、背景多樣等特點,因此,往往在通用目標檢測上較為成功的算法無法直接遷移到文字檢測中,但近年來隨著深度學習的再次興起,對文本檢測的研究也成為了一大熱點,出現了大量專用于文本檢測的方法,且都取得了不錯的檢測效果。
根據文本檢測所用方法的技術特點,目前比較流行的文本檢測方法可大致分為兩類,第一類是基于滑動窗口的文本檢測方法,它主要是基于通用目標檢測的思想,設置大量不同長寬比、不同大小的錨點框,以這些錨點框為滑動窗口,在圖像上或者在從圖像上進行過卷積操作得到的特征映射圖上進行遍歷搜索,對于每個搜索到的位置框,進行框內是否是文本的分類判定,這種方法的優點是矩形框判定之后,不需要其余的后續處理便可進行后續工作,缺點是計算量過大,不僅需要耗費大量計算資源,而且耗時較長;第二類是基于計算連通域的方法,也稱基于分割思想的方法,它主要是先使用全卷積神經網絡模型提取圖像特征,然后對特征圖進行二值化并計算其連通域,然后根據不同地應用場景(即不同地訓練數據集),使用一些特定的方法,判斷文本行位置,這種方法的優點是計算快速,計算量小,缺點是后處理步驟繁瑣,涉及大量的計算和調優,這不僅會消耗大量時間,同時,后處理策略是否合理有效也嚴格制約著算法的性能。
CenterNet是一種用于通用目標檢測的Anchor-free的方法,可視為基于回歸的方法。CenterNet是一種通用目標檢測框架,效果好且速度非???,完全可以滿足密集目標場景的要求,但是卻很難用它進行密集文本檢測,因為在實際密集文本場景中,矩形框的長寬比例異常極端,同時,其大小分布無規律也是非常常見的,這種情況下,漏檢是非常常見的,如果使用CenterNet,是可以滿足速度的要求的,但是無法取得令人滿意的效果。
發明內容
為此,本發明提供了一種文本識別方法、裝置、可讀存儲介質及計算設備,以力圖解決或者至少緩解上面存在的至少一個問題。
根據本發明實施例的一個方面,提供了一種文本識別方法,包括:
獲取原始文本圖像;
將所述原始文本圖像按照預設順序輸入多個特征提取網絡,分別獲取所述多個特征提取網絡的輸出特征;其中,所述特征提取網絡包括多個殘差塊,對于任意的符合所述預設順序的相鄰的第一特征提取網絡和第二特征提取網絡,所述第二特征提取網絡的輸出特征是根據所述第二特征提取網絡中每個殘差塊的原始輸出特征以及所述第一特征提取網絡中最后一個殘差塊的輸出特征獲得的;
根據所述多個特征提取網絡的輸出特征,分別得到所述原始文本圖像的多組文本識別結果;
合并所述原始文本圖像的多組文本識別結果,得到最終的文本識別結果。
可選地,根據所述第二特征提取網絡中每個殘差塊的原始輸出特征以及所述第一特征提取網絡中最后一個殘差塊的輸出特征獲得所述第二特征提取網絡的輸出特征,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110581348.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種二乙基甲苯二胺的制備方法
- 下一篇:一種中藥藥材的粉碎研磨裝置





