[發明專利]一種文字檢測方法、裝置、電子設備及存儲介質有效
| 申請號: | 201811647657.1 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109766885B | 公開(公告)日: | 2022-01-18 |
| 發明(設計)人: | 謝鋒明;萬昭祎;姚聰 | 申請(專利權)人: | 北京曠視科技有限公司 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V30/10;G06N3/04;G06N3/08 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100190 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 檢測 方法 裝置 電子設備 存儲 介質 | ||
本發明提供了一種文字檢測方法、裝置、電子設備及存儲介質,該方法包括:獲取待檢測圖像;將所述待檢測圖像輸入檢測模型進行識別,得到所述待檢測圖像中的目標區域和所述目標區域中的空隙區域,所述空隙區域包括空格或符號;根據所述目標區域和所述空隙區域,確定包含待識別文字的詞級別區域;對所述詞級別區域進行文字識別,得到對應的文字識別結果。本發明由于檢測目標區域時同時考慮了目標區域內待識別文字間的空隙區域,從而識別文字時可以去除空隙區域,對連續的文字進行識別,從而可以提高文字識別的準確率。
技術領域
本發明涉及圖像識別技術領域,特別是涉及一種文字檢測方法、裝置、電子設備及存儲介質。
背景技術
在共享出行、金融、財務、保險和電商等行業的業務中,經常涉及到銀行卡(包括借記卡、信用卡等)、身份證、駕駛證或行駛證等卡片或證件信息,而其中的文字是關鍵信息,需要對文字進行識別以獲取重要信息。
現有技術中,在對卡片或證件中的文字進行識別時,往往框選整個段落進行整體識別,在文字間包含字符時,容易產生錯誤的識別結果。
發明內容
鑒于上述問題,提出了本發明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種文字檢測方法、裝置、電子設備及存儲介質。
依據本發明實施例的第一方面,提供了一種文字檢測方法,包括:
獲取待檢測圖像;
將所述待檢測圖像輸入檢測模型進行識別,得到所述待檢測圖像中的目標區域和所述目標區域中的空隙區域,所述空隙區域包括空格或符號;
根據所述目標區域和所述空隙區域,確定包含待識別文字的詞級別區域;
對所述詞級別區域進行文字識別,得到對應的文字識別結果。
可選的,將所述待檢測圖像輸入所述檢測模型進行識別,得到所述待檢測圖像中的目標區域和對應的空隙區域,包括:
將所述待檢測圖像輸入所述檢測模型進行識別,得到所述待檢測圖像中的目標區域和所述目標區域的熱力圖,所述熱力圖包括空隙區域的位置和對應的空隙類型,所述空隙類型包括空格或符號類型;
對所述詞級別區域進行文字識別,得到對應的文字識別結果,包括:
對所述詞級別區域進行文字識別,并結合所述空隙區域的位置和對應的空隙類型,得到對應的文字識別結果。
可選的,所述根據所述目標區域和所述空隙區域,確定包含待識別文字的詞級別區域,包括:
確定所述目標區域和所述空隙區域的交叉區域;
將所述交叉區域從所述目標區域內去除,得到所述詞級別區域。
可選的,在獲取待檢測圖像及對應的檢測模型之前,還包括:
獲取已標注目標區域和空隙區域的樣本訓練集;
針對所述樣本訓練集,利用卷積神經網絡進行訓練,得到所述檢測模型。
可選的,對所述詞級別區域進行文字識別,得到對應的文字識別結果,包括:
根據所述詞級別區域,確定所述待識別文字的最小外接矩形;
根據所述最小外接矩形,確定所述待識別文字的文本區域;
對所述文本區域進行文字識別,得到對應的文字識別結果。
依據本發明實施例的第二方面,提供了一種文字檢測裝置,包括:
獲取模塊,用于獲取待檢測圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司,未經北京曠視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811647657.1/2.html,轉載請聲明來源鉆瓜專利網。





