[發明專利]一種半色調文檔圖像的噪聲處理方法有效
| 申請號: | 200910022698.6 | 申請日: | 2009-05-26 |
| 公開(公告)號: | CN101567049A | 公開(公告)日: | 2009-10-28 |
| 發明(設計)人: | 宋永紅;肖桂林;孟高峰;張元林;雷冬冬 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06K9/40 | 分類號: | G06K9/40;G06K9/00 |
| 代理公司: | 西安通大專利代理有限責任公司 | 代理人: | 惠文軒 |
| 地址: | 710049陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 色調 文檔 圖像 噪聲 處理 方法 | ||
技術領域
本發明涉及計算機視覺和圖形、圖像處理領域,特別涉及一種半色調文 檔圖像的噪聲處理方法,可應用于掃描文檔圖像、傳真圖像等各種半色調文 檔圖像的文字去噪和文字提取,可進一步應用于半色調圖像文檔的文字識別 及全文檢索領域。
背景技術
隨著打印機、掃描儀及傳真機的普及,半色調文檔圖像廣泛地應用于社 會生活的各個領域。因此,為了實現半色調文檔圖像的文字識別及全文檢索, 針對半色調文檔圖像的文字去噪及文字提取技術顯得非常有必要。一種傳統 的方法是對半色調圖像進行逆半色調化,將其轉化成對應的灰度圖,但是, 經這種方法處理后,圖像中通常會產生較嚴重的模糊,使得文字部分的細節 丟失,從而降低文字的識別率。另一種傳統方法是對圖像中的半色調點直接 進行處理,可有效地避免產生文字模糊現象,然而,如何在去除半色調點圖 像中的圖像部分、圖形部分的同時,又保證盡量不丟失文字部分的細節,成 為該技術中需要解決的一個關鍵問題。
發明內容
本發明的目的在于提供一種半色調文檔圖像的噪聲處理方法,能夠去除 半色調文檔圖像中的背景噪聲,消除文字的毛刺噪聲,保持文字筆畫的完整 性以及光順性。
為了達到上述目的,本發明采用以下技術方案予以實現。
一種半色調文檔圖像的噪聲處理方法,其特征在于,包括以下步驟:
首先,將半色調文檔圖像分為四類:淺色背景和深色文字、淺色背景和 淺色文字、深色背景和深色文字、深色背景和淺色文字;
其次,去除半色調文檔圖像的背景噪聲:對于淺色背景和深色文字的半 色調文檔圖像,采用基于連通區域標記的方法去除背景噪聲;對于淺色背景 和淺色文字的半色調文檔圖像,采用基于高斯平滑濾波的方法去除背景噪聲; 對于深色背景和深色文字的半色調文檔圖像、深色背景和淺色文字的半色調 文檔圖像,采用基于維納濾波的方法去除背景噪聲;
最后,觀察去除背景噪聲的半色調文檔圖像,構造文字的毛刺去除模板 和缺陷修復模板,通過模板匹配去除文字毛刺和修復文字缺陷。
本發明的進一步改進和特點在于:
(1)所述將半色調文檔圖像分為四類,具體為:對半色調文檔圖像進行 高斯平滑濾波,計算高斯平滑濾波后半色調文檔圖像的Otsu閾值及灰度直方 圖,根據Otsu閾值估計背景的半色調點密度,根據灰度直方圖估計文字的半 色調點密度,并根據背景的半色調點密度和文字的半色調點密度,將半色調 文檔圖像分為四類,即淺色背景和深色文字、淺色背景和淺色文字、深色背 景和深色文字、深色背景和淺色文字。
(2)所述文字的毛刺去除模板用表格表示,包括:
其中,單元格代表像素,單元格之間的位置關系代表像素間的位置關系; 單元格中,1表示文字像素,0表示背景像素,①表示需要去除的文字像素, 即需要把文字像素1變為背景像素0;空單元格表示為背景像素0或文字像素 1。
(3)所述缺陷修復模板用表格表示,包括以下表格:
其中,單元格代表像素,單元格之間的位置關系代表像素間的位置關系; 單元格中,1表示文字像素,0表示背景像素,表示需要修復的文字像素, 即需要把背景像素0變為文字像素1;空單元格表示為背景像素0或文字像素 1。
本發明通過將半色調文檔圖像分成四類別,再對這四個類別自適應地選 擇最合適的背景噪聲的去除方法,能在進行半色調文檔圖像初步去噪的同時, 盡可能多的保持文字的細節,然后,通過構造的一系列文字的毛刺去除模板 和缺陷修復模板,通過模板匹配,對初步去噪的半色調文檔圖像的文字進行 毛刺去除以及缺陷修復,使得進一步對文字的OCR識別變得更加容易。
本發明對于基于誤差擴散的半色調文檔圖像更有效,一方面在于基于誤 差擴散的半色調技術可以用一個近似的線性模型來模擬,因此維納濾波的方 法對于該類半色調圖像更有效;另一方面在于基于誤差擴散的半色調技術上 利用半色調點的密度而非半色調點的大小來把灰度圖像轉化成半色調圖像 的,因此基于聯通區域標記的方法對于該類半色調圖像更有效。
附圖說明
下面結合附圖和具體實施方式對本發明做進一步詳細說明。
圖1是半色調文檔圖像的噪聲處理方法的總體流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910022698.6/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





