[發明專利]基于筆劃寬度的文檔圖像無參二值化方法有效
| 申請號: | 201310654770.3 | 申請日: | 2013-12-05 |
| 公開(公告)號: | CN103761520A | 公開(公告)日: | 2014-04-30 |
| 發明(設計)人: | 陳強;陸圣陶;汪青;王玉萍 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06K9/38 | 分類號: | G06K9/38;G06K9/60 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 馬魯晉 |
| 地址: | 210094 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 筆劃 寬度 文檔 圖像 無參二值化 方法 | ||
技術領域
本發明涉及一種圖像二值化處理的方法,特別是一種基于筆劃寬度的文檔圖像無參全自動二值化方法。
背景技術
文檔圖像二值化對于文檔的自動化分析具有重要的意義,因為二值化效果的好壞將直接決定后續的識別過程。文檔圖像二值化是一個經典而富有挑戰性的問題,目前已出現了很多種不同的方法,其中基于閾值的方法可以分為兩類:全局和局部閾值。其中全局閾值方法以Otsu方法為主,包括各種對該方法的改進,如修改判別準則,著重強調目標區域的灰度同質性,而忽略背景區域的多樣性等。
筆劃作為文檔圖像中的重要因素,對于文檔圖像的二值化具有重要影響。如利用筆劃寬度的一致性,出現了幾種文檔圖像二值化方法,主要包括:(1)利用形狀信息生成全局閾值,(2)利用筆劃寬度自適應地生成局部閾值,(3)基于筆劃模型從灰度文檔圖像中抽取字符。
現有的基于筆劃寬度的文檔圖像二值化方法存在如下缺陷:(1)筆劃的寬度估計方法不具有旋轉不變性,或需要事先人為設定;(2)需要訓練,不是無監督的方法;(3)是有參的方法,需要針對不同的圖像設置不同的參數。
發明內容
本發明的目的在于提供一種基于筆劃寬度的文檔圖像無參全自動二值化方法。
實現本發明的目的的技術解決方案為:一種基于筆劃寬度的文檔圖像無參二值化方法,包括以下步驟:
步驟1、對文檔圖像進行采集;
步驟2、采用高斯濾波對采集到的文檔圖像進行去噪處理;其中高斯濾波的公式為:
式中,g(x,y)為高斯濾波函數,(x,y)為圖像坐標,σ為標準偏差。高斯濾波的窗口大小優選為3×3,標準偏差σ優選為1。
步驟3、根據文檔圖像所在的灰度范圍生成二值化結果;具體為:
采用文檔圖像的閾值區間(Imin,Imax)內的每個灰度值生成對應的二值化結果,其中Imin和Imax分別表示文檔圖像的灰度最小值和最大值。
步驟4、根據筆劃半徑選擇最佳的二值化結果,所述初始筆劃半徑為1;具體為:
步驟4-1、確定文本和背景像素的個數,Nt和Nb,具體過程如下:
(1)采用形態學閉運算得到厚目標區域TcOk:
其中和分別表示形態學膨脹和腐蝕操作,Sk表示半徑為w+k-1的圓盤形結構元,w為筆劃半徑,Bi為二值化文檔圖像;
(2)確定細目標區域TnOk,所用公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310654770.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種面向集團用戶的出入口全局控制方法和系統
- 下一篇:一種分體式熱得快





