[發明專利]一種碎紙機破碎英文文檔的恢復方法有效
| 申請號: | 201310694779.7 | 申請日: | 2013-12-17 |
| 公開(公告)號: | CN103700081A | 公開(公告)日: | 2014-04-02 |
| 發明(設計)人: | 沈亞雄;雷浩;楊捷 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06T5/50 | 分類號: | G06T5/50;G06T7/00 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210098 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 碎紙機 破碎 英文 文檔 恢復 方法 | ||
技術領域
本發明涉及圖像處理和信息恢復技術領域,具體涉及一種基于破碎紙片的邊緣信息和破碎文字的幾何特征的碎紙機破碎英文文檔的恢復方法。
背景技術
碎紙機已經成為日常辦公時重要的一部分,很多企業、科研機構和軍隊會出于保密的需要,使用碎紙機對重要文件、資料進行銷毀,而在實際生活中,在許多情況下,需要將已經破碎的文檔重新恢復。然而傳統上,拼接復原工作需由人工完成,準確率較高,但效率很低,特別是當碎片數量巨大,人工拼接很難在短時間內完成任務,計算機具有快速處理海量數據的能力,而通過計算機算法對破碎英文文檔進行恢復的研究還非常少,特別是恢復既被縱切又被橫切的破碎紙片,因此,急需一種能夠有效恢復破碎英文文檔的方法。
發明內容
發明目的:本發明為解決現有技術中存在的不足,提供一種碎紙機破碎英文文檔的恢復方法。
技術方案:一種碎紙機破碎英文文檔的恢復方法,包括以下步驟:
(1)圖像數字化:使用掃描儀對紙質英文文檔碎片進行處理,并輸出BMP格式的原始圖像f(i,j),共有這樣的圖像p×q張,其中p指每一列碎紙片的張數,q指每一行碎紙片的張數;
(2)圖像預處理:
步驟一、對BMP格式的圖像文件進行預處理,提取圖像的灰度,所有處理后的每張圖像都是一個m×n的灰度矩陣,其中m指灰度矩陣的行數,n指灰度矩陣的列數;
步驟二、分別處理左右邊界點;對于左邊界點,若灰度值為255,則變為1;若灰度值為0,則不變;若灰度值為0~255之間的數,則根據次邊界點的灰度值,將灰度值變為0或1,具體步驟為:將最左列第i行的灰度值Z1i與次左列同行的灰度值Z2i進行比較,若Z1i>Z2i,則Z1i=0,反之則Z1i=1;對于右邊界點,若灰度值為255,則變為1;若灰度值為0,則不變;若灰度值為0~255之間的數,則根據次邊界點的灰度值,將灰度值變為0或1,具體步驟為:將最右列第i行的灰度值Y1i與次右列同行的灰度值Y2i進行比較,若Y1i>Y2i,則Y1i=1,反之則Y1i=0;其中,Z1i是指m×n的灰度矩陣中最左列第i行的灰度值,Z2i是指m×n的灰度矩陣中次左列第i行的灰度值,Y1i是指m×n的灰度矩陣中最右列第i行的灰度值,Y2i是指m×n的灰度矩陣中次右列第i行的灰度值;
步驟三、處理中間點:通過設定灰度閾值將左右邊界點之外的其他部分進行二值化處理,若一點的灰度值大于該閾值,則設定為1即為白點,反之設定為0即為黑點,所有處理后的每張圖像都是一個m×n的二值化矩陣,其中m指二值化矩陣的行數,n指二值化矩陣的列數;
(3)碎片拼接:
1)、提取出處于同一行的破碎紙片,52個大、小英文字母中僅有7個字母會通過的四線三格紙的中、下格分界線,將四線三格紙中的第三條線作為每張碎紙片的定位線;定位線所處的行白點數目較少,而定位線的下一行則幾乎全是白點;根據這一特征,將所有紙片的二值化矩陣按行求和,記為Adi,其中Adi表示第d張紙片第i行二值化矩陣在該行求和的值;任取一張紙片d1,找到其定位線所處的行h,則可以得到一個值B,B值反應了會在定位線處發生突變的情況,由于B值是其中一張紙片的二值化矩陣按行求和的值在定位線處的突變情況,有其特殊性;但又因為在同一次破碎文檔的恢復中,破碎紙片的大小相同,設定的灰度閾值也相同,所以所有的破碎紙片在定位線處的二值化矩陣按行求和的值突變的情況也應類似。即若第d2張紙片第r+1行二值化矩陣在該行求和的值與第r行二值化矩陣在該行求和的值之比近似等于B,則第d2張紙片的定位線在r行,即;其中,W為常數,需要根據分行的效果確定,反應了紙片在定位線處二值化矩陣按行求和的值突變處于一個與B近似的范圍之中,而不是一個特定的值;
根據這一方法,可以找出所有紙片的定位線所處的位置,定位線位置相同的碎紙片就處于同一行,進而可挑出處于同一行的破碎紙片;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310694779.7/2.html,轉載請聲明來源鉆瓜專利網。





