[發明專利]一種帶有文本方向校正的英文文本檢測方法有效
| 申請號: | 201810429149.X | 申請日: | 2018-05-08 |
| 公開(公告)號: | CN108647681B | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 代勁;王族;尹航 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62 |
| 代理公司: | 重慶輝騰律師事務所 50215 | 代理人: | 王海軍 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本區域 方向校正 文本 候選文本 文本檢測 分類器 卷積神經網絡 圖像處理技術 英文文本圖像 非文本區域 分組 英文 場景文本 多層空間 分組算法 極值區域 多尺度 多通道 提取池 源圖像 校正 并行 過濾 精細 圖像 檢測 引入 | ||
本發明屬于圖像處理技術領域,具體為一種帶有文本方向校正的英文文本檢測方法;所述方法包括:分別對英文文本圖像各個通道的進行最大穩定極值區域檢測,得出候選文本區域;建立基于卷積神經網絡模型的分類器,過濾錯誤的候選文本區域,獲得初步文本區域;利用雙層文本分組算法將所述初步文本區域分組;將分組后的初步文本區域進行方向校正,從而獲得校正文本;本發明采用一種增強的多通道MSER模型:以得到更精細的文本區域;引入并行SPP?CNN分類器來更好地區分文本區域和非文本區域,可以處理任意大小的圖像,且可在多尺度下提取池特征,從而可以通過源圖像的多層空間信息來了解更多的特征;本發明可以處理略微傾斜的場景文本。
技術領域
本發明屬于圖像處理技術領域,具體為一種帶有文本方向校正的英文文本檢測方法。
背景技術
自然場景圖像中的文本具有準確、豐富的信息,這對于圖像分析、基于圖像的翻譯、圖像搜索等具有重要意義。在過去的20年里,研究人員提出了一些在自然場景圖像中檢測文本的方法。有許多基于內容的多媒體理解應用,如自動視覺分類、圖像檢索、輔助導航、多語言翻譯、對象識別和面向消費者的應用。
場景文本檢測面臨的關鍵問題是:(1)文檔圖像中的文本具有常規字體,相似顏色,均勻大小和均勻排列,但即使在同一場景中,自然場景中的文本也可能具有不同的字體,顏色,比例和方向。(2)自然場景圖像的背景可能非常復雜。標志、柵欄、磚塊和草地難以與真實文本區分開來,因此容易造成混淆和錯誤。(3)場景文字圖像中的其他干擾因素。如不均勻照明,模糊,半透明效應等。
研究人員提出了許多方法來檢測自然場景圖像中的文本,并且有兩種主要方法。
基于紋理的方法,將文本視為一種特殊類型的紋理,并使用它們的紋理屬性,如局部強度、濾波器響應和小波系數來區分圖像的文本區域和非文本區域。通常這些方法的計算量很大,因為要掃描所有位置和尺度。此外,這些方法主要處理橫向文本,對旋轉和縮放非常敏感;
基于組件的方法,將文本視為連通組件,首先通過各種方法(如顏色聚類或極端區域提取)提取文本,然后使用手動設計的規則或自動訓練的分類器對非文本組件進行過濾。通常,基于組件的方法更有效,因為要處理的組件數量相對較少。另外,這些方法對旋轉,縮放和字體都不敏感。檢測候選文本區域(Candidate Text Region,記為CTR)的傳統方法有最大穩定極值區域(Maximally Stable Extremal Regions,記為MSER),該方法對于圖像的仿射變化具有很強的魯棒性,可以有效地提取圖像中的文本區域,后有學者改進了MSER的提取算法,使算法的時間復雜度達到線性時間。
這些方法按照區分文本區域和非文本區域的規則或特征,從而將文本區域和非文本區域區別開來,雖然這些方法能夠檢測出文本,但缺少對英文文本的校正,且對傾斜文本的區分效果并不好,識別出的文本會因為單詞的傾斜而存在嚴重分離。
發明內容
有鑒于此,本發明提出了一種帶有文本方向校正的英文文本檢測方法,能夠有效的識別出文本,并將識別出傾斜文本進行校正,具體包括以下步驟:
S1、分別對英文文本圖像的銳化圖像各個通道進行最大穩定極值區域檢測,從圖像中提取MSER作為文本候選;得出候選文本區域;
S2、建立基于卷積神經網絡模型的分類器,提取出候選文本區域的特征;利用softmax函數根據候選文本區域的特征,將候選文本區域分為文本類區域和非文本類區域;過濾非文本類區域,獲得初步文本區域,即檢測出英文文本;
S3、利用雙層文本分組算法將所述初步文本區域分組;
S4、將分組后的初步文本區域進行方向校正,從而實現英文文本的校正。
進一步的,所述通道包括:紅色通道、綠色通道、藍色通道、色調通道、飽和度通道、明度通道以及灰通道。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810429149.X/2.html,轉載請聲明來源鉆瓜專利網。





