[發明專利]文本框檢測方法、裝置、電子設備和計算機存儲介質有效
| 申請號: | 202011584194.6 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112308051B | 公開(公告)日: | 2021-10-29 |
| 發明(設計)人: | 張蓓蓓;秦勇 | 申請(專利權)人: | 北京易真學思教育科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 楊瑾瑾;林軍 |
| 地址: | 100144 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本框 檢測 方法 裝置 電子設備 計算機 存儲 介質 | ||
本申請公開了一種文本框檢測方法、裝置、電子設備和計算機存儲介質。具體實現方案為包括:將目標圖像輸入目標模型,得到所述目標模型輸出的兩個分支的通道;其中,所述兩個分支的通道包括用于表示N個檢測框的中心點及其尺寸相關信息的第一分支通道,以及用于表示所述N個檢測框的邊界點的相關信息的第二分支通道;其中,N為大于等于1的整數;基于所述第一分支通道確定所述N個檢測框;基于所述第二分支通道,確定所述N個檢測框分別對應的多個邊界標注點;基于所述N個檢測框分別對應的多個邊界標注點,確定所述目標圖像中包含的N個目標文本框。
技術領域
本申請涉及圖像處理領域,尤其涉及一種文本框檢測方法、裝置、電子設備和計算機存儲介質。
背景技術
近年來,隨著目標檢測在眾多領域的應用,使其在計算機視覺領域引起了很大關注,一些基于深度學習的目標檢測方法成為焦點,其中,針對文本框的檢測通常采用CenterNet框架進行,但是利用CenterNet框架進行密集文本檢測,往往會出現框不全或者框住大量背景圖像的問題。
發明內容
為了解決現有技術中上述至少一個問題,本申請實施例提供一種文本框檢測方法、裝置、電子設備和計算機存儲介質。
第一方面,本申請實施例提供一種文本框檢測方法,所述方法包括:
將目標圖像輸入目標模型,得到所述目標模型輸出的兩個分支的通道;其中,所述兩個分支的通道包括用于表示N個檢測框的中心點及其尺寸相關信息的第一分支通道,以及用于表示所述N個檢測框的邊界點的相關信息的第二分支通道;其中,N為大于等于1的整數;
基于所述第一分支通道確定所述N個檢測框;
基于所述第二分支通道,確定所述N個檢測框分別對應的多個邊界標注點;
基于所述N個檢測框分別對應的多個邊界標注點,確定所述目標圖像中包含的N個目標文本框。
第二方面,本申請實施例提供一種文本框檢測裝置,所述裝置包括:
模型處理單元,用于將目標圖像輸入目標模型,得到所述目標模型輸出的兩個分支的通道;其中,所述兩個分支的通道包括用于表示N個檢測框的中心點及其尺寸相關信息的第一分支通道,以及用于表示所述N個檢測框的邊界點的相關信息的第二分支通道;其中,N為大于等于1的整數;
第一檢測單元,用于基于所述第一分支通道確定所述N個檢測框;
第二檢測單元,用于基于所述第二分支通道,確定所述N個檢測框分別對應的多個邊界標注點;
文本框確定單元,用于基于所述N個檢測框分別對應的多個邊界標注點,確定所述目標圖像中包含的N個目標文本框。
第三方面,本申請實施例提供一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行本申請任意一項實施例所提供的方法。
第四方面,本申請實施例提供一種存儲有計算機指令的非瞬時計算機可讀存儲介質,所述計算機指令用于使所述計算機執行本申請任意一項實施例所提供的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京易真學思教育科技有限公司,未經北京易真學思教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011584194.6/2.html,轉載請聲明來源鉆瓜專利網。





