[發明專利]對圖片進行文本檢測的方法及裝置有效
| 申請號: | 201511016818.3 | 申請日: | 2015-12-29 |
| 公開(公告)號: | CN105631426B | 公開(公告)日: | 2019-05-07 |
| 發明(設計)人: | 喬宇;黃韡林;賀通 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46 |
| 代理公司: | 深圳中一專利商標事務所 44237 | 代理人: | 張全文 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖片 進行 文本 檢測 方法 裝置 | ||
本發明適用于計算機技術領域,提供了對圖片進行文本檢測的方法及裝置,包括:獲取進行文本檢測的圖片;將所述圖片輸入全卷積網絡的第一層,在所述第一層中基于文本區域的序列特征,檢測出所述圖片中的文本區域;將所述文本區域輸入到所述全卷積網絡的第二層,在所述第二層中基于文本中間線的監督分類器,將所述文本區域分解為獨立的文本行區域輸出,所述文本中間線的區域由高斯分布的函數定義。本發明基于兩層級聯式的全卷積網絡,對圖片中的文本行進行提取,不僅充分節省了重疊區域之間的計算資源,而且利用了文本更高層的序列特征作為監督信息,提高了文本檢測算法的魯棒性。
技術領域
本發明屬于計算機技術領域,尤其涉及對圖片進行文本檢測的方法及裝置。
背景技術
目前,對圖片進行文本檢測的算法主要分為兩類:基于滑動窗口的方法和基于連通區域的方法。基于滑動窗口的方法是通過一個大小可變的滑動子窗口掃描一張圖片所有可能的位置,來檢測文本信息,其利用一個訓練好的分類器來判別窗口內是否有文本信息;基于連通區域的方法首先通過一個底層的濾波器快速分割文本和非文本像素,然后把具有相似屬性的文本像素連通起來構成文本成分,筆畫寬度轉化(SWT)算法和最穩定極值區域(MSREs)算法是此類方法的代表。然而,上述方法的分類網絡采用全連接層,丟失了文本區域的位置信息。
發明內容
有鑒于此,本發明實施例提供了對圖片進行文本檢測的方法及裝置,以解決現有技術會丟失文本區域的位置信息的問題。
第一方面,提供了一種對圖片進行文本檢測的方法,包括:
獲取進行文本檢測的圖片;
將所述圖片輸入全卷積網絡的第一層,在所述第一層中基于文本區域的序列特征,檢測出所述圖片中的文本區域;
將所述文本區域輸入到所述全卷積網絡的第二層,在所述第二層中基于文本中間線的監督分類器,將所述文本區域分解為獨立的文本行區域輸出,所述文本中間線的區域由高斯分布的函數定義。
另一方面,提供了一種對圖片進行文本檢測的裝置,包括:
獲取單元,用于獲取進行文本檢測的圖片;
第一處理單元,用于將所述圖片輸入全卷積網絡的第一層,在所述第一層中基于文本區域的序列特征,檢測出所述圖片中的文本區域;
第二處理單元,用于將所述文本區域輸入到所述全卷積網絡的第二層,在所述第二層中基于文本中間線的監督分類器,將所述文本區域分解為獨立的文本行區域輸出,所述文本中間線的區域由高斯分布的函數定義。
本發明實施例基于兩層級聯式的全卷積網絡,對圖片中的文本行進行提取,不僅充分節省了重疊區域之間的計算資源,而且利用了文本更高層的序列特征作為監督信息,提高了文本檢測算法的魯棒性。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明實施例提供的對圖片進行文本檢測的網絡結構圖;
圖2是本發明實施例提供的對圖片進行文本檢測的方法的實現流程圖;
圖3是本發明實施例提供的文本中間線的檢測示意圖;
圖4是本發明實施例提供的對圖片進行文本檢測的檢測效果示意圖;
圖5是本發明實施例提供的對圖片進行文本檢測裝置的結構框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201511016818.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:環繞可揭式標簽
- 下一篇:車載控制器局域網總線信息記錄及轉換輸出裝置





