[發明專利]基于字符紋理區域分割的打印文件鑒別方法在審
| 申請號: | 201710558236.0 | 申請日: | 2017-07-10 |
| 公開(公告)號: | CN107273898A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 陳慶虎;周小丹 | 申請(專利權)人: | 武漢珞珈博研科技有限責任公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06T7/11 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙)42222 | 代理人: | 薛玲 |
| 地址: | 430000 湖北省武*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 字符 紋理 區域 分割 打印 文件 鑒別方法 | ||
技術領域
本發明涉及打印文件的源機認定技術領域,尤其涉及基于紋理特征的打印文件鑒別方法,目的是實現兩份打印文件的一對一鑒別。
背景技術
由于每臺打印機在生產時的參數配置和使用中的損耗情況都是獨一無二的,因此打印出的文件也都不相同,這也是打印文件可區分鑒定的客觀基礎,所謂打印文件鑒別就是鑒定兩份打印文件是否來自同一打印機的技術。
隨著計算機和打印機的普及,打印文件也逐漸取代手寫文件成為承載信息的主要媒介,與此同時,有關打印文件篡改、偽造等犯罪行為也日益增多,因此打印文件鑒別的相關研究領域成為文件檢驗領域的熱點和難點。在兩份打印文件在相同字符較多的情況容易鑒別,當打印文件內容少、相同字符少時,有效的鑒別方法不多。本發明提出了一種基于字符紋理區域分割的打印文件鑒別方法,以解決在沒有相同字符匹配或者相同字符很少的情況下打印文件的鑒別難題。
發明內容
為解決兩份打印文件相同字符較少情況下鑒別難題,本發明利用字符紋理區域分割的方法,提取與字符結構無關的紋理特征。打印文件圖像的紋理信息承載了其打印機的特性,可利用紋理特征鑒別兩份打印文件是否來自同一打印機。
本發明采用如下技術方案為,基于字符紋理區域分割的打印文件鑒別方法,包括如下步驟:
(1)利用圖像整體高倍放大掃描系統采集打印文件的單個字符紋理圖像;
(2)通過聚類方法將字符紋理圖像分割為三個區域:字符內部、字符邊緣和字符外部,具體實現方式如下;
步驟2.1,對整體放大后的打印文件圖像進行中值濾波;
步驟2.2,將中值濾波后的圖像的每一個像素點的灰度值作為樣本x,進行K‐means聚類時選擇類別數目k=3,使每個集合中的類內平方和最小,即找到滿足下式的聚類Si:
其中μi是集合Si中所有點的均值,μ1、μ2、μ3分別表示字符內部均值、字符邊緣均值和字符外部均值;根據聚類結果對字符紋理圖像的像素點進行標識,得到字符紋理區域分割標識圖;
(3)分別對步驟(2)中不同區域計算其旋轉不變等價模式的LBP,利用歸一化處理之后的LBP直方圖作為統計特征,并將不同區域的特征進行組合疊加;
(4)以一份打印文件的所有字符紋理圖像的區域分割后提取的LBP直方圖特征均值作為該打印文件所屬打印機的鑒別特征;
(5)根據兩份打印文件所屬打印機的鑒別特征距離,判別兩份打印文件是否來自同一臺打印機。
進一步,步驟(3)中所述旋轉不變等價模式的LBP計算方式如下,
其中,
riu2表示U值最大為2的旋轉不變等價模式,P表示鄰域像素點數,R表示鄰域半徑,gi表示鄰域中第i個像素點的灰度值,g0表示鄰域中i=0時的像素點灰度值,gP-1表示鄰域中i=P-1時的像素點灰度值,gc表示中心點像素的灰度值。由于鄰域是圓形鄰域,默認以中心點為坐標原點構成的極坐標系中,0°方向上的像素點為i=0的像素點。s(x)為符號函數,當x≥0時,s(x)=1;當x<0時,s(x)=0。
進一步的,步驟(5)的實現方式如下,首先計算兩份打印文件所屬打印機的鑒別特征距離,
其中,一臺打印文件的源機特征可描述為M張圖像的特征均值Feal,
上式中xl為每張圖像提取的特征,由步驟(3)得到;當距離Dist小于經驗閾值,則判定兩份打印文件來自同一打印機;否則,來自不同打印機。
進一步的,所述的經驗閾值采用貝葉斯估計方法獲得,具體是通過采集100臺打印機的打印文件樣本,分別計算相同打印機的打印文件間的距離分布與不同打印機的打印文件間的距離分布,以兩類錯誤率之和最小為準則,找到經驗閾值。
與現有技術相比,本發明方法不需要打印文件有相同字符,提高了打印文件鑒別方法的適用范圍和準確率。
附圖說明
圖1為本發明實施例中單個字符紋理圖像;
圖2為本發明實施例中中值濾波示意圖;
圖3為本發明實施例中字符紋理區域分割示意圖;
圖4為本發明實施例的整體流程示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢珞珈博研科技有限責任公司,未經武漢珞珈博研科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710558236.0/2.html,轉載請聲明來源鉆瓜專利網。





