[發明專利]一種文字圖像濃淡調整的方法有效
申請號: | 201110361814.4 | 申請日: | 2011-11-15 |
公開(公告)號: | CN103106673A | 公開(公告)日: | 2013-05-15 |
發明(設計)人: | 胡希馳;李平立;史培培 | 申請(專利權)人: | 北京大學;方正國際軟件(北京)有限公司 |
主分類號: | G06T11/00 | 分類號: | G06T11/00 |
代理公司: | 北京天悅專利代理事務所(普通合伙) 11311 | 代理人: | 田明;任曉航 |
地址: | 100871*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 文字 圖像 濃淡 調整 方法 | ||
技術領域
本發明涉及文字圖像處理領域,具體涉及一種文字圖像濃淡調整的方法。
背景技術
在文字圖像處理時,由于掃描條件的不同,掃描出的文檔圖像灰度分布也不同。對于實際的版面數字化生產中,不同的OCR(Optical?Character?Recognition,光學字符識別)引擎對于不同“濃淡”程度的文字圖像準確率也不同。有些對于“淡”一些的文字識別率較高,有些對于“濃”一些的文字識別率較高。當灰度圖作為輸出保存時,則需要將文字調整到人眼閱讀舒適的程度。
在圖像處理領域已有很多的圖像灰度調整技術,如直方圖均衡等。但是這些通用的灰度調整技術并非專門針對文字掃描圖像所設計的,也無法給出“濃淡”度量。而在生產中還在使用工人利用圖像處理軟件手工調整的方式,如灰階、拉曲線等方式。由于每一頁都需要調整,對于大規模的圖書加工,效率低、成本高,無法滿足要求。此外由于對于“濃淡”的判斷主觀性很強,不同人的認知可能不同,因此,需要利用圖像處理技術設計一種自動調整的方法,。
在現有技術中,申請號為CN201010568385.3、名稱為“一種調整版面濃淡的方法與系統”的專利申請公開了一種調整版面濃淡的方法與系統。此篇專利中的調整方法利用的是二值圖中的黑白像素比例,但是無法得到灰度圖,其本質是調整二值圖中文字比劃的粗細。現有技術存在的問題是僅僅利用二值圖黑白像素數量比例,只能輸出二值圖,反應了筆畫的粗細,但無法反映文字灰度的深淺。
發明內容
針對現有技術中存在的缺陷,本發明的目的在于提供一種文字圖像濃淡調整的方法,通過該方法實現對文字圖像的自動處理方法,不僅能夠反映筆畫的粗細,還能夠反映筆畫灰度的深淺,同時保持文字邊界處的灰階變化。
為實現上述目的,本發明采用的技術方案如下:
一種文字圖像濃淡調整的方法,包括以下步驟:
(1)獲得文字圖像的灰度直方圖以及文字圖像的初始黑場值和初始白場值,并對文字圖像進行二值化處理得到文字圖像的二值圖像;
(2)將二值圖像進行連通域標記,并計算每個連通域的最小外接矩形和細化骨架區域;
(3)分別計算每個連通域的最小外接矩形區域內所有像素點的黑度和值,和每個連通域的細化骨架區域內所有像素點的黑度和值,并計算每個連通域的最小外接矩形內所有像素點的黑度和值與該連通域的細化骨架區域內所有像素點的黑度和值的比值,記為黑度和值比;其中,黑度和值為所有像素點的黑度值之和,黑度值Dark(x,y)=1-f(x,y),f(x,y)表示像素點坐標為(x,y)的像素值歸一化后的像素值;
(4)計算文字圖像的濃淡值dense,濃淡值是指所有連通域的黑度和值比的和與連通域的個數的比值;
(5)查看濃淡值dense與設定濃淡值的誤差絕對值是否小于設定值,若是則結束對文字圖像的調整;若否則調整文字圖像的黑場值或/和白場值并返回步驟(2);所述設定濃淡值是用戶根據實際文字圖像調整需要而設定的文字圖像的目標濃淡值。
進一步,如上所述的一種文字圖像濃淡調整的方法,步驟(5)中,若調整文字圖像的黑場值或/和白場值后,若重新計算濃淡值dense的次數達到設定的計算次數的邊界條件,則結束對文字圖像的調整。
進一步,如上所述的一種文字圖像濃淡調整的方法,步驟(5)中,所述設定值的范圍為0.001~0.01。
進一步,如上所述的一種文字圖像濃淡調整的方法,所述設定值的優選值為0.001。
進一步,如上所述的一種文字圖像濃淡調整的方法,在對文字圖像的濃淡進行調整前,將文字圖像的像素值歸一化到[0,1]。
進一步,如上所述的一種文字圖像濃淡調整的方法,步驟(2)中,計算每個連通域的最小外接矩形后,還包括對所述連通域進行合并,合并的具體方式如下:
確定文字語言種類,若是中文為主,則合并連通域最小外接矩形處于相交、包含位置關系的連通域;若是英文為主,則合并連通域最小外接矩形之間間隙小于設定值的相鄰連通域。
進一步,如上所述的一種文字圖像濃淡調整的方法,步驟(2)中,對連通域進行合并后,還包括對連通域的篩選,篩選的具體方式如下:
確定文字語言種類,若是中文為主,則篩選M個合并后最小外接矩形為正方形的合并連通域;若是英文為主,則篩選N個合并后滿足設定的字符長度的合并連通域,其中,10≤M≤40,10≤N≤40。
再進一步,如上所述的一種文字圖像濃淡調整的方法,所述設定的字符長度為4~12個字符長度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學;方正國際軟件(北京)有限公司,未經北京大學;方正國際軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110361814.4/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序