[發(fā)明專利]一種利用筆畫對比和邊緣密度特征濾除非文字邊緣的方法有效
| 申請?zhí)枺?/td> | 201510943600.6 | 申請日: | 2015-12-16 |
| 公開(公告)號: | CN105528603B | 公開(公告)日: | 2018-07-27 |
| 發(fā)明(設計)人: | 宋永紅;馮媛媛;張元林 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32 |
| 代理公司: | 西安智大知識產權代理事務所 61215 | 代理人: | 何會俠 |
| 地址: | 710049*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 筆畫 對比 邊緣 密度 特征 除非 文字 方法 | ||
本發(fā)明公開一種利用筆畫對比和邊緣密度特征濾除非文字邊緣的方法,1、對于一副輸入圖像,計算它在灰度通道上的邊緣圖,并從正反兩面進行筆畫寬度變換,得到筆畫對數(shù)目向量和筆畫寬度變換圖;2、對邊緣圖像中的每條邊緣,計算筆畫對比;對每一層筆畫寬度變換圖上的每個連通區(qū)域,計算該連通區(qū)域的邊緣密度特征;對于每一條邊緣,如果其筆畫對比小于預設閾值,則濾除該邊緣;對于每個連通區(qū)域,如果其邊緣密度大于預設閾值,則濾除該連通區(qū)域內所有的邊緣連通分支;筆畫寬度變換是一種常用的文字區(qū)域粗定位方法,但很多非文字的邊緣也會產生很多筆畫,而筆畫對比和邊緣密度特征,可以去除大量的背景邊緣,減少了后續(xù)步驟的處理難度。
技術領域
本發(fā)明屬于自然場景圖像文字檢測技術領域,具體涉及一種利用筆畫對比和邊緣密度特征濾除非文字邊緣的方法。
背景技術
自然場景圖像文字檢測是指,從一幅自然場景中拍攝的圖片中檢測并定位出圖像中的文字的技術。該技術對于基于語義的檢索,盲人輔助等系統(tǒng)的完善都具有重要的意義。僅僅使用光學字符識別(OCR)對自然場景中文字進行識別,識別效果往往很差,主要因為自然場景中拍攝的圖像往往包含了大量復雜的背景,比如窗戶,欄桿,樹葉等,會造成很多的誤檢。因此,如果使用文字檢測技術先將文字區(qū)域定位出來,再進行OCR,便可以極大的提高識別準確率。然而,自然場景文字檢測的主要難點,主要來源于兩個方面,一是圖像質量較差,圖像質量往往會受到拍攝條件的制約,文字部分有時會因為反光,被遮擋,失焦等原因,從而導致正常的檢測方法失效;二是文字本身的形態(tài)帶來的難點,比如藝術字,低分辨率和浮雕文字。
發(fā)明內容
本發(fā)明針對上述問題,提供了一種利用筆畫對比和邊緣密度特征濾除非文字邊緣的方法,該方法在筆畫寬度變換的基礎上,通過提取筆畫對比和邊緣密度特征,對邊緣圖中的背景邊緣進行濾除,從而減少了候選邊緣分支的數(shù)目,降低了后續(xù)處理的時間復雜度。
為了達到上述目的,本發(fā)明采用如下技術方案:
一種利用筆畫對比和邊緣密度特征濾除非文字邊緣的方法,包括以下步驟:
步驟A:對于一副輸入圖像,計算它在灰度通道上的邊緣圖,并從正反兩面進行筆畫寬度變換,其中,正面指原圖,反面指原圖取反操作后得到的圖;得到筆畫對數(shù)目向量和筆畫寬度變換圖;
步驟B:對于邊緣圖像中的每一條邊緣,分別利用正反兩面的筆畫寬度變換圖,計算筆畫對比;對每一層筆畫寬度變換圖上的每一個連通區(qū)域,計算該連通區(qū)域的邊緣密度特征;對于每一條邊緣,如果其筆畫對比小于預設閾值,則濾除該邊緣;對于每一個連通區(qū)域,如果其邊緣密度大于預設閾值,則濾除該連通區(qū)域內所有的邊緣連通分支。
所述步驟A的具體步驟如下:
步驟A01:對于一副輸入圖像,首先計算它的灰度通道圖,并使用canny算子進行邊緣檢測,得到邊緣圖并進行連通區(qū)域標記;
步驟A02:對于邊緣圖,分別從正反兩個方向,進行筆畫寬度變換;筆畫寬度變換時,如果從某一邊緣像素p沿著梯度方向出發(fā),在搜索范圍內找到另一邊緣像素q,且q的梯度與p的梯度之差在預設范圍內,則稱p找到了筆畫對;否則,稱p沒有找到筆畫對;建立一個大小為邊緣連通區(qū)域數(shù)目eNum*1大小的向量,每當一個標記為i的邊緣點找到對應筆畫對時,向量的第i個位置的值增加1,該向量即為筆畫對數(shù)目向量;建立一個大小和邊緣圖大小一樣的筆畫寬度變換圖,初始賦值均為0,如果某一邊緣點找到了筆畫對,則在筆畫寬度變換圖上將從邊緣點出發(fā)的搜索路徑上的像素全部標記為1。
所述步驟B具體步驟如下:
步驟B01:對邊緣圖,分別利用正反兩個方向的筆畫寬度變換圖,計算筆畫對比特征,筆畫對比特征是一個邊緣連通分支中找到了筆畫對的邊緣像素的個數(shù)與該邊緣連通分支中所有像素的個數(shù)之比;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經(jīng)西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510943600.6/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





