[發(fā)明專利]一種用以增強(qiáng)文字與背景差異的邊緣響應(yīng)統(tǒng)計(jì)變換方法有效
| 申請(qǐng)?zhí)枺?/td> | 201610850397.2 | 申請(qǐng)日: | 2016-09-26 |
| 公開(公告)號(hào): | CN106650579B | 公開(公告)日: | 2019-06-14 |
| 發(fā)明(設(shè)計(jì))人: | 宋永紅;賀翔;張?jiān)?/a> | 申請(qǐng)(專利權(quán))人: | 西安交通大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/46;G06K9/20;G06K9/32 |
| 代理公司: | 西安智大知識(shí)產(chǎn)權(quán)代理事務(wù)所 61215 | 代理人: | 何會(huì)俠 |
| 地址: | 710049 陜*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用以 增強(qiáng) 文字 背景 差異 邊緣 響應(yīng) 統(tǒng)計(jì) 變換 方法 | ||
1.一種用以增強(qiáng)文字與背景差異的邊緣響應(yīng)統(tǒng)計(jì)變換方法,其特征在于:包括以下步驟:
步驟A:對(duì)于一副輸入的包含文本的自然場(chǎng)景圖像,計(jì)算該圖像中的邊緣包圍框,其中邊緣包圍框是指對(duì)圖像中邊緣目標(biāo)可能存在的位置用矩形包圍框標(biāo)注,而邊緣目標(biāo)既包含文字邊緣目標(biāo),也可能包含其它物體邊緣目標(biāo);依據(jù)邊緣包圍框的分?jǐn)?shù)對(duì)所有邊緣包圍框遞減排序,其中邊緣包圍框的分?jǐn)?shù)由包圍框內(nèi)完全包含的輪廓個(gè)數(shù)來確定;按照文字邊緣在所有物體邊緣目標(biāo)中的分布特性對(duì)排序后的邊緣包圍框進(jìn)行篩選,并對(duì)篩選出的邊緣包圍框集合進(jìn)行加權(quán)求和計(jì)算,其中權(quán)值由反比例函數(shù)確定;得到邊緣響應(yīng)特征圖;
步驟B:在邊緣響應(yīng)特征圖上按行方向依次累加響應(yīng)值,得到行方向上的統(tǒng)計(jì)邊緣響應(yīng)圖,簡(jiǎn)稱行統(tǒng)計(jì)圖;對(duì)行統(tǒng)計(jì)圖計(jì)算梯度,得到梯度圖;對(duì)梯度圖取正,并使其與行統(tǒng)計(jì)圖量綱統(tǒng)一;對(duì)量綱統(tǒng)一后的梯度圖執(zhí)行非極大值抑制操作,得到文本行粗定位結(jié)果;
所述步驟A的具體步驟如下:
步驟A01:對(duì)于一副輸入的包含文本的自然場(chǎng)景圖像,建立一個(gè)大小和輸入圖像一樣的邊緣響應(yīng)特征圖e,初始賦值均為0;
步驟A02:對(duì)于輸入原圖進(jìn)行結(jié)構(gòu)化邊緣檢測(cè)得到邊緣圖像,其中邊緣圖像由邊緣點(diǎn)組成,邊緣點(diǎn)的值代表該點(diǎn)是邊緣的概率;將近似處于一條直線上的邊緣點(diǎn)集中形成邊緣段,得到n個(gè)邊緣段{s1,s2,...,sn};計(jì)算邊緣段兩兩之間的相似度a(si,sj),根據(jù)相似度為邊緣段賦權(quán)值wb(si),i=1,2,...,n;依據(jù)邊緣段權(quán)值為邊緣包圍框評(píng)分,得到m個(gè)候選邊緣包圍框{b1,b2,...,bn}及其相應(yīng)分?jǐn)?shù){sb1,sb2,...,sbn};
步驟A03:對(duì)于在輸入圖像上產(chǎn)生的m個(gè)候選邊緣包圍框,按照分?jǐn)?shù)sb對(duì)邊緣包圍框遞減排序;依據(jù)文字邊緣在所有物體邊緣目標(biāo)中的分布特性來對(duì)邊緣包圍框進(jìn)行篩選,使得篩選出的k個(gè)包圍框盡可能完整地覆蓋輸入圖像中的文本區(qū)域,并能夠使引入的虛警區(qū)域最小化;
步驟A04:將k個(gè)邊緣包圍框加權(quán)求和,其中權(quán)值是由一個(gè)反比例函數(shù)確定,反比例函數(shù)是f(i)=64/(8+(i-1)),i=1,2,...,k,并對(duì)邊緣響應(yīng)特征圖e賦值,賦值公式是以上步驟即為邊緣響應(yīng)統(tǒng)計(jì)變換過程。
2.根據(jù)權(quán)利要求1所述的一種用以增強(qiáng)文字與背景差異的邊緣響應(yīng)統(tǒng)計(jì)變換方法,其特征在于:所述步驟B具體步驟如下:
步驟B01:在邊緣響應(yīng)特征圖e上按行依次累加響應(yīng)值,按行累加響應(yīng)值的公式是其中l(wèi)表示邊緣響應(yīng)變換圖e的長(zhǎng)度,w表示e的寬度;得到行方向上的統(tǒng)計(jì)邊緣響應(yīng)圖,簡(jiǎn)稱行統(tǒng)計(jì)圖,其中行統(tǒng)計(jì)圖的橫坐標(biāo)表示輸入圖像中第i行所處的位置,縱坐標(biāo)表示在第i行上出現(xiàn)文本行的概率;
步驟B02:對(duì)行統(tǒng)計(jì)圖求梯度值,梯度計(jì)算公式是得到梯度圖;其中梯度圖的橫坐標(biāo)表示輸入圖像中第i行所處的位置,縱坐標(biāo)表示在第i行上邊緣響應(yīng)變換的強(qiáng)度;第i行梯度值越大,則該行上下的響應(yīng)值變化越劇烈,那么第i行是文字與背景間隙的概率越大;
步驟B03:對(duì)梯度圖取正,接著使梯度圖與行統(tǒng)計(jì)圖量綱統(tǒng)一,量綱統(tǒng)一的公式是其中是統(tǒng)一量綱的處理,以便于梯度圖與行統(tǒng)計(jì)圖的觀察以及后續(xù)的非極大值抑制操作;通過令各梯度值按其幅度值與最大幅度值的比值來加權(quán),使得文字與背景區(qū)域更具有區(qū)分度;經(jīng)實(shí)驗(yàn)所得常數(shù)值k=3.5,其作用是避免一些梯度幅度值較小的真值被誤刪;
步驟B04:對(duì)量綱統(tǒng)一后的梯度圖,執(zhí)行非極大值抑制操作;在非極大值抑制過程中,設(shè)定滑動(dòng)窗大小為winSize=l/20,其中l(wèi)是輸入圖像的長(zhǎng)度;得到文本行粗定位結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安交通大學(xué),未經(jīng)西安交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610850397.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 增強(qiáng)片及增強(qiáng)方法
- 圖像增強(qiáng)設(shè)備和圖像增強(qiáng)方法
- 圖像增強(qiáng)裝置、圖像增強(qiáng)方法
- 粉狀增強(qiáng)減水劑及摻有粉狀增強(qiáng)減水劑的增強(qiáng)水泥
- 增強(qiáng)片、增強(qiáng)構(gòu)件、增強(qiáng)套件、增強(qiáng)片的制造方法及增強(qiáng)構(gòu)件的制造方法
- 增強(qiáng)片、增強(qiáng)構(gòu)件、增強(qiáng)套件、增強(qiáng)片的制造方法及增強(qiáng)構(gòu)件的制造方法
- 使用增強(qiáng)模型的增強(qiáng)現(xiàn)實(shí)系統(tǒng)
- 增強(qiáng)片及增強(qiáng)結(jié)構(gòu)體
- 圖像增強(qiáng)方法和圖像增強(qiáng)裝置
- 增強(qiáng)現(xiàn)實(shí)鏡片、增強(qiáng)現(xiàn)實(shí)眼鏡及增強(qiáng)現(xiàn)實(shí)成像方法





