[發明專利]文本檢測方法、裝置、電子設備和存儲介質有效
| 申請號: | 201810769512.2 | 申請日: | 2018-07-13 |
| 公開(公告)號: | CN110717486B | 公開(公告)日: | 2022-08-05 |
| 發明(設計)人: | 王杰;鄭鋼;程戰戰;鈕毅 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 韓東艷 |
| 地址: | 310051 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 檢測 方法 裝置 電子設備 存儲 介質 | ||
本申請公開了一種文本檢測方法、裝置、電子設備和存儲介質,屬于圖像檢測技術領域。所述方法包括:基于待檢測的目標圖像,確定所述目標圖像對應的特征圖像,并基于所述特征圖像中確定所述特征圖像中的每個像素點的形變特征;根據所述特征圖像中的每個像素點的形變特征,獲取所述特征圖像中的每個像素點的形變參數;根據所述特征圖像中的每個像素點的形變參數,從所述特征圖像中確定文本區域。本申請中由于結合了像素點的形變特征對特征圖像進行檢測,從而能夠檢測任一形變文本,進而提高了檢測準確性。
技術領域
本申請涉及圖像檢測技術領域,特別涉及一種文本檢測方法、裝置、電子設備和存儲介質。
背景技術
文本檢測是指從圖像中檢測出文本區域。文本檢測技術可以作為信息采集錄入手段、比如對卡證、卷宗、報表等的文本區域自動檢測,提供高質量的文本區域給文本識別器,可以省下手工輸入的成本。文本檢測技術也可以作為圖像信息理解的重要前提,對圖像中的文本區域進行檢測,并提取文本區域中的內容,從而實現理解圖像內容。
目前從圖像中檢測出文本區域的過程可以為:將回歸目標設定為軸平行矩形,通過移動該矩形在圖像中的位置,并將該圖像中該矩形中的區域為目標區域,并檢測該目標區域是否為文本區域。
在實現本申請的過程中,申請人發現現有技術至少存在以下問題:
由于圖像中的文本區域的形狀不一定是矩形,當圖像中的文本區域為存在扭曲、透視、旋轉等形狀變化的文本區域時,通過以上方法就無法準確檢測出來。
發明內容
本申請提供了一種文本檢測方法、裝置、設備和存儲介質,可以解決現有技術中的無法檢測出形變文本的文本區域的問題。技術方案如下:
一方面,本申請提供了一種文本檢測方法,所述方法包括:
基于待檢測的目標圖像,確定所述目標圖像對應的特征圖像,并基于所述特征圖像中確定所述特征圖像中的每個像素點的形變特征;
根據所述特征圖像中的每個像素點的形變特征,獲取所述特征圖像中的每個像素點的形變參數;
根據所述特征圖像中的每個像素點的形變參數,從所述特征圖像中確定文本區域。
在一個可能的實現方式中,所述基于所述特征圖像中確定所述特征圖像中的每個像素點的形變特征,包括:
對于所述特征圖像中的每個像素點,確定所述像素點在多個方向上的多個采集偏移量,多個采集偏移量不完全相同;
以所述像素點為中心,所述多個采集偏移量為所述多個方向上的步長,獲取所述像素點的相鄰像素點的特征值;
基于所述相鄰像素點的特征值,確定所述像素點的形變特征。
在一個可能的實現方式中,所述根據所述特征圖像中的每個像素點的形變參數,從所述特征圖像中確定文本區域,包括:
從所述特征圖像中確定第一圖像形變區域;
根據所述第一圖像形變區域中的每個像素點的形變參數,從所述第一圖像形變區域中確定形變參數對應的第二圖像形變區域;
根據所述第二圖像形變區域中的每個像素點的形變參數,將所述第二圖像形變區域轉換為指定形狀的圖像檢測區域;
通過所述指定形狀對應的檢測模型,檢測所述圖像檢測區域中的內容是否為本文內容;
當所述圖像檢測區域中的內容為文本內容時,將所述圖像檢測區域確定為文本區域。
在一個可能的實現方式中,所述從所述特征圖像中確定第一圖像形變區域,包括:
確定所述特征圖像中的每個像素點屬于文本的置信度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810769512.2/2.html,轉載請聲明來源鉆瓜專利網。





