[發(fā)明專利]基于背景估計(jì)和能量最小化的低質(zhì)量文檔圖像二值化方法有效
| 申請?zhí)枺?/td> | 201710289747.7 | 申請日: | 2017-04-27 |
| 公開(公告)號: | CN107133929B | 公開(公告)日: | 2019-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 熊煒;徐晶晶;李敏;熊子婕;王改華;劉敏;趙楠;王鑫睿;馮川 | 申請(專利權(quán))人: | 湖北工業(yè)大學(xué) |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T7/62;G06T7/13 |
| 代理公司: | 武漢科皓知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430068 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 背景 估計(jì) 能量 最小化 質(zhì)量 文檔 圖像 二值化 方法 | ||
本發(fā)明公開了一種基于背景估計(jì)和能量最小化的低質(zhì)量文檔圖像二值化方法,首先對彩色文檔圖像進(jìn)行灰度預(yù)處理、采用雙邊濾波對圖像進(jìn)行降噪處理、圖像背景估計(jì)、背景減除與圖像增強(qiáng)、構(gòu)造能量函數(shù)、構(gòu)造網(wǎng)絡(luò)圖、最后采用基于增廣路徑的圖割算法實(shí)現(xiàn)能量函數(shù)的最小化。本發(fā)明顯著提高了復(fù)雜背景下的文檔圖像二值化效果,能夠適用于多種顏色書寫、筆畫漸變、墨跡浸潤、頁面有污漬或紋理、光照不均、對比度低等復(fù)雜背景的文檔圖像二值化處理。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)字圖像處理、模式識別與機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,特別是涉及一種基于背景估計(jì)和能量最小化的低質(zhì)量文檔圖像二值化方法。
背景技術(shù)
文檔分析與識別(DAR)技術(shù)已廣泛應(yīng)用于古籍?dāng)?shù)字化、版面分析與文字識別、視頻字幕提取、文本信息檢索等領(lǐng)域,主要包括圖像的采集、二值化、歪斜校正、字符分割與識別等過程。圖像二值化是其中一個關(guān)鍵預(yù)處理環(huán)節(jié),它是將灰度圖像轉(zhuǎn)換成二進(jìn)制圖像,從而實(shí)現(xiàn)字符前景與文檔背景的分離。二值化算法的效果直接影響整個DAR系統(tǒng)的性能,因此近年來很多學(xué)者對此進(jìn)行了研究,并提出了很多算法;然而,受圖像對比度差、墨跡浸潤、頁面污漬或光照不均等因素的影響,使得低質(zhì)量文檔圖像二值化仍是一個挑戰(zhàn)。
二值化算法可粗略分為全局閾值法和局部閾值法。全局閾值法采用單一的閾值將文檔圖像分為字符(前景)與背景兩大類,如Otsu算法利用圖像的灰度直方圖選擇一個最優(yōu)閾值,使得經(jīng)閾值分割后的前景與背景像素的類間方差最大。全局閾值法對于前景和背景差別較大,即直方圖具有顯著雙峰特征的圖像具有較好的分割效果,但在處理低質(zhì)量文檔圖像時(shí),會丟失部分甚至全部前景細(xì)節(jié)。
局部閾值法(也稱為自適應(yīng)閾值法)則通過滑動窗口與文檔圖像的卷積,從而實(shí)現(xiàn)在圖像不同部分設(shè)定不同閾值,如Niblack、Sauvola、Wolf等算法利用像素鄰域內(nèi)的灰度均值和方差來構(gòu)建閾值分割曲面,其算法性能有賴于滑動窗口的尺寸及字符筆畫的粗細(xì)等。針對不同質(zhì)量的文檔圖像需動態(tài)調(diào)整窗口尺寸,以獲得最佳的閾值處理結(jié)果;當(dāng)圖像對比度較低時(shí),會產(chǎn)生大量噪聲點(diǎn)或造成誤判。
此外,國內(nèi)外研究人員還提出了很多更為復(fù)雜的算法,如局部對比度法、背景估計(jì)與筆畫邊緣檢測法、拉普拉斯能量法、卷積神經(jīng)網(wǎng)絡(luò)法等。然而,以上這些方法都不能很好地解決在低對比度、墨跡浸潤、漸變光照、帶污跡和紋理等復(fù)雜文檔背景下的圖像二值化。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本發(fā)明提出了一種基于背景估計(jì)和能量最小化的低質(zhì)量文檔圖像二值化方法,顯著提高了復(fù)雜背景下的文檔圖像二值化效果,能夠適用于多種顏色書寫、筆畫漸變、墨跡浸潤、頁面有污漬或紋理、光照不均、對比度低等復(fù)雜背景的文檔圖像二值化處理。
本發(fā)明所采用的技術(shù)方案是:一種基于背景估計(jì)和能量最小化的低質(zhì)量文檔圖像二值化方法,其特征在于,包括以下步驟:
步驟1:對彩色文檔圖像進(jìn)行灰度預(yù)處理;
步驟2:采用雙邊濾波對圖像進(jìn)行降噪處理;
步驟3:圖像背景估計(jì),具體包括以下子步驟:
步驟3.1:針對步驟2處理后的圖像,進(jìn)行筆畫寬度變換;
步驟3.2:計(jì)算模擬距離和成像高度;
步驟3.3:針對步驟2處理后的圖像,通過兩次形態(tài)學(xué)閉操作削弱文檔圖像中的暗特征;
步驟3.4:結(jié)合步驟3.2和步驟3.3的結(jié)果,進(jìn)行圖像降采樣和升采樣;
步驟4:背景減除與圖像增強(qiáng),具體包括以下子步驟:
步驟4.1:背景減除;
計(jì)算步驟2中的雙邊濾波圖像與步驟3中的背景估計(jì)圖像間的絕對差值,差值圖像中灰度為零的像素點(diǎn)屬于高置信背景像素點(diǎn),并將其灰度值設(shè)為255;
步驟4.2:直方圖均衡;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖北工業(yè)大學(xué),未經(jīng)湖北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710289747.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





