[發明專利]文本檢測方法、裝置、電子設備及存儲裝置在審
| 申請號: | 202010030861.X | 申請日: | 2020-01-10 |
| 公開(公告)號: | CN111259764A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 張勇東;周宇;謝洪濤 | 申請(專利權)人: | 中國科學技術大學;北京中科研究院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/46;G06K9/62 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 王中葦 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 檢測 方法 裝置 電子設備 存儲 | ||
一種文本檢測方法,應用于文本檢測技術領域,包括:提取待檢測圖像的多種尺度的文本特征,得到多種尺度的文本特征圖,將該多種尺度的文本特征圖進行級聯,得到包含多種尺度信息的級聯文本特征圖,根據該級聯文本特征圖,預測該待檢測圖像中的文本區域和文本中心區域,采用形狀感知的聚類算法,根據該文本區域和文本中心區域,重建得到該待檢測圖像中的精確的文本框。本申請還提供了一種文本檢測裝置、電子設備及存儲裝置,可從場景圖像中檢測出任意形狀的文本,提升文本檢測效果。
技術領域
本申請涉及文本檢測領域,尤其涉及一種文本檢測方法、裝置、電子設備及存儲裝置。
背景技術
場景文本檢測是指從自然場景圖像中定位出其中包含的所有文本,是文本識別的前提步驟,在圖像檢索,場景理解,自動駕駛和文本翻譯等領域有很多應用。主流的文本檢測方法可以大致分為基于回歸和基于分割兩類方法。這些方法存在兩個主要的問題:1、由于缺乏多尺度感受野,它們對于多尺度文本的檢測效果不好;2、由于相鄰文本的邊界框可能存在重疊,因此經常會錯誤地將靠得近的幾個文本檢測為一個。
發明內容
本申請的主要目的在于提供一種文本檢測方法、裝置、電子設備及存儲裝置,可提升文本檢測效果。
為實現上述目的,本申請實施例第一方面提供一種文本檢測方法,包括:
提取待檢測圖像的多種尺度的文本特征,得到多種尺度的文本特征圖;
將所述多種尺度的文本特征圖進行級聯,得到包含多種尺度信息的級聯文本特征圖;
根據所述級聯文本特征圖,預測所述待檢測圖像中的文本區域和文本中心區域;
采用形狀感知的聚類算法,根據所述文本區域和文本中心區域,重建得到所述待檢測圖像中的精確的文本框。
可選的,所述文本區域中的文本置信度為[0,1]之間的實數。
可選的,所述提取待檢測圖像的多種尺度的文本特征,得到多種尺度的文本特征圖包括:
采用多種不同尺度的池化操作,提取待檢測圖像的多種尺度的文本特征,得到多種尺度的文本特征圖。
可選的,所述多種不同尺度包括1×1、3×3、5×5、7×7。
可選的,所述將所述多種尺度的文本特征圖進行級聯,得到包含多種尺度信息的級聯文本特征圖之前,包括:
將所述多種尺度的文本特征圖分別經過上采樣到1/4所述待檢測圖像的大小。
可選的,所述根據所述級聯文本特征圖,預測所述待檢測圖像中的文本區域和文本中心區域包括:
使用1×1卷積將所述級聯文本特征圖的通道數變成2,得到相同大小的兩個所述級聯文本特征圖;
將相同大小的兩個所述級聯文本特征圖分別上采樣到所述待檢測圖像的大小后,在相同大小的兩個所述級聯文本特征圖中分別提取文本區域和文本中心區域。
本申請實施例第二方面提供一種文本檢測裝置,包括:
提取模塊,用于提取待檢測圖像的多種尺度的文本特征,得到多種尺度的文本特征圖;
級聯模塊,用于將所述多種尺度的文本特征圖進行級聯,得到包含多種尺度信息的級聯文本特征圖;
預測模塊,用于根據所述級聯文本特征圖,預測所述待檢測圖像中的文本區域和文本中心區域;
重建模塊,用于采用形狀感知的聚類算法,根據所述文本區域和文本中心區域,重建得到所述待檢測圖像中的精確的文本框。
可選的,所述文本區域中的文本置信度為[0,1]之間的實數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學;北京中科研究院,未經中國科學技術大學;北京中科研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010030861.X/2.html,轉載請聲明來源鉆瓜專利網。





