[發明專利]一種基于文檔圖像自動去除黑邊的方法在審
| 申請號: | 201710777958.5 | 申請日: | 2017-09-01 |
| 公開(公告)號: | CN107516085A | 公開(公告)日: | 2017-12-26 |
| 發明(設計)人: | 孫鑫;王長征;劉文曉;趙勝男 | 申請(專利權)人: | 山西同方知網數字出版技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06T5/00 |
| 代理公司: | 北京天奇智新知識產權代理有限公司11340 | 代理人: | 李振文 |
| 地址: | 030006 山西省太*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文檔 圖像 自動 去除 方法 | ||
技術領域
本發明涉及圖像識別和圖像處理的技術領域,尤其涉及一種基于文檔圖像的缺陷檢測、缺陷識別、自動去除及去除后效果評估的方法。
背景技術
在文檔高速掃描的過程中,圖像邊緣會出現一些不規則的黑邊(黑邊是指掃描圖像的黑色邊緣),黑邊會對圖像的視覺效果、信息讀取和版面分析等方面造成影響,從而影響用戶的正常使用。在數字出版、圖書館管理、檔案管理、企業內部資料管理系統中,此類問題尤為突出。因此,去除黑邊對改善視覺效果以及提高識別率等方面有著非常重要的作用。
發明內容
為解決上述技術問題,本發明的目的是提供一種基于文檔圖像自動去除黑邊的方法,該方法能自動檢測、識別、自動去除黑邊,并對去除后的效果作出評估。
本發明的目的通過以下的技術方案來實現:
一種基于文檔圖像自動去除黑邊的方法,包括:
A對文檔圖像進行預處理;
B檢測文檔圖像中的缺陷;
C根據文檔圖像缺陷檢測結果,判斷并識別缺陷種類,包括圖像黑邊、版面位置;
D去除文檔圖像黑邊;
E根據文檔圖像黑邊去除結果,判斷并給出黑邊去除置信度。
與現有技術相比,本發明的一個或多個實施例可以具有如下優點:
可以達到自動去黑邊的功能,同時給出結果置信度判斷;原來的算法有將文字刪除掉,或是黑邊去除不干凈等問題,本發明解決了多去除或去除不凈的問題;原來的算法沒有對去除結果做評估,本發明給出結果置信度判斷,對去黑邊效果作出評估。
附圖說明
圖1是基于文檔圖像自動去除黑邊的方法流程圖;
圖2是結果置信度評估屬A類的去黑邊前后對比圖;
圖3是結果置信度評估屬E類的去黑邊前后對比圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面將結合實施例及附圖對本發明作進一步詳細的描述。
如圖1所示,為基于文檔圖像自動去除黑邊的方法,包括以下步驟:
步驟10對文檔圖像進行預處理;
步驟20檢測文檔圖像中的缺陷;
步驟30根據文檔圖像缺陷檢測結果,判斷并識別缺陷種類,包括圖像黑邊、版面位置;
步驟40去除文檔圖像黑邊;
步驟50根據文檔圖像黑邊去除結果,判斷并給出黑邊去除置信度。
上述步驟10對文檔圖像的預處理包括糾偏、版心居中和二值化。
上述步驟20具體包括:深度優先遍歷圖像,自動搜索缺陷的連通區域。
上述步驟30中黑邊缺陷判斷包括:
用一定尺寸的模板判斷某個缺陷區域是否屬于黑邊區域,假定當前判斷模板的大小為M×N,k是其中的白色像素數,σ是一個比較小的閾值,計算模板內白色像素的密度k/(M×N),當k/(M×N)<σ時,判斷該缺陷為黑邊。
黑邊的寬高比具有隨機性,但為了放置誤刪頁眉線、表格線等有用信息,需將寬與高的比值設定為小于ε。
缺陷種類識別中,版面位置也很重要。根據版面分析,判斷缺陷所在位置是否屬于文字區域以外的版面。
上述步驟50根據去除黑邊的效果,對處理后的文檔圖像做版面分析,確定文檔內容(包括文字與非文字)區域,對文檔內容區域外的部分做投影,根據投影結果,分析是否屬于未去除干凈的黑塊黑邊,給予評估,做出置信度判斷,分為去除后完全正確的A類(如圖2所示),疑似有未去除干凈的E類(如圖3所示)。
上述實施例可以通過缺陷檢測、識別,自動全面地將圖像中的黑邊去掉,達到了自動化處理要求,并根據結果分析去黑邊的效果,分析其置信度。將黑邊完全去除的頁面設為置信度A,將黑邊以外無法去除的黑塊、打印孔及未去除干凈的頁面設為置信度E,這樣提高了工作效率,增加了結果的準確性。
雖然本發明所揭露的實施方式如上,但所述的內容只是為了便于理解本發明而采用的實施方式,并非用以限定本發明。任何本發明所屬技術領域內的技術人員,在不脫離本發明所揭露的精神和范圍的前提下,可以在實施的形式上及細節上作任何的修改與變化,但本發明的專利保護范圍,仍須以所附的權利要求書所界定的范圍為準。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西同方知網數字出版技術有限公司,未經山西同方知網數字出版技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710777958.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動測試平臺
- 下一篇:開關柜狀態監測裝置及系統
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





