[發明專利]基于大數據處理的印刷數據識別方法有效
| 申請號: | 202111063256.3 | 申請日: | 2021-09-10 |
| 公開(公告)號: | CN113506297B | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 葛峰 | 申請(專利權)人: | 南通天成包裝有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/12;G06T7/13;G06T5/00;G06N3/04;G06N3/08 |
| 代理公司: | 鄭州知倍通知識產權代理事務所(普通合伙) 41191 | 代理人: | 夏開松 |
| 地址: | 226000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 數據處理 印刷 數據 識別 方法 | ||
1.一種基于大數據處理的印刷數據識別方法,該方法包括以下步驟,步驟一:使用語義分割技術將采集到的RGB圖像分割得到印刷品圖像;步驟二:對標準圖像和印刷圖像進行處理,得到各自的圖像描述;包括:對印刷品圖像進行邊緣檢測,獲得對應的邊緣圖像;提取邊緣圖像內閉合的連通域;設置初始參數,印刷圖像的各連通域分別設置對應的初始值,包括像素個數N=0,層數L=0;極限坐標:;
由于不同圖像的像素大小不同,故而連通域的面積參數用該連通域的像素個數與整個圖像的總像素個數的比值來表示,即該連通域面積參數S:
;
式中,N為連通域的像素個數,為整個圖像的像素個數;
逐行遍歷圖像的像素點,獲得:圖像中每行的像素點都有其對應的連通域標簽序列,形式如下:
;其中0為背景像素即非連通域像素,0之外的數字為對應連通域的標簽號,對標簽值進行處理,獲得該行下連通域的層次信息,由于一個連通域是一個閉合區域,所以在圖像的一行像素上從左到右遍歷時,它的標簽號要至少出現兩次,第一次為開始進入這個連通域,第二次為離開這個連通域,存在嵌套結構的連通域,必然是大連通域包含小連通域,所以連通域的嵌套層數一旦確定是不會改變的,如果,表示對應連通域的嵌套層數未確定,當時,不需要更改L的值,設置一個臨時變量C=0,從左向右進行遍歷,記錄第一個非0數字,上述連通域標簽序列中對應的數字為1,其對應的C設置為1,此由于標簽號為1的連通域的嵌套層數,所以對應的連通域的嵌套層數L的值更新為C,表示該連通域的最大嵌套層數為1,此時記錄下的非0標簽序列為;第二個非0數字,上述連通域標簽序列中對應的數字為3,已記錄的標簽序列中不存在數字3,記錄該數字,所得標簽序列為,此時令,表示進入更深一層的嵌套連通區域中,由于標簽號為3的連通域最大嵌套層次,更新,表示標簽號為3的連通域的最大嵌套層數為2;第三個非0數字為2,不在已記錄的非0標簽序列內,將數字2記錄進標簽序列,此時的非0數字標簽序列為,由于標簽號2的連通域的嵌套層數,令,表示標簽號為2的連通域的最大嵌套層數為3;繼續遍歷,第四個遍歷的非0數字為2,由于之前記錄的數字序列中已經存在2,表示標簽為2的連通域遍歷已經結束,不再將其記錄進標簽序列;令C減1,此時C=2,即此時遍歷的像素點位于嵌套層次為2的連通域中,以此類推,每遇到一個新的連通域,即記錄的非0數字標簽序列中不存在的標簽號,使C加1,表示進入到更深一層的嵌套區域中;每離開一個連通域,令C減1,表示回到上一層的嵌套區域中;另外,在每次對C進行加1操作時,需要判斷對應標簽號的嵌套層次L是否為0,直到遍歷完該行像素,每遍歷一個帶標簽的像素點,就使對應標簽的像素個數;比較該帶標簽的像素點坐標與已有的橫縱坐標的最大值和最小值:,,,進行比較,包括:某遍歷的標簽像素點坐標為,若,則,否則保持不變;若,則,否則保持不變;對同理;遍歷結束后,得到中心點坐標,其中;得到,以及各自的嵌套層數L;計算各個連通域整體特征值,用連通域中心點坐標到原點距離以及連通域面積表示:
;
得到每個連通域的描述情況;
步驟三:對比標準圖像與印刷圖像的圖像描述,判斷印刷異常的情況。
2.根據權利要求1所述的一種基于大數據處理的印刷數據識別方法,其特征在于對印刷品圖像進行邊緣檢測,獲得對應的邊緣圖像具體包括:輸入印刷圖像,將圖像灰度化處理后,使用Canny算子對圖像進行邊緣檢測,得到梯度邊緣,即為印刷區域中圖案的邊緣。
3.根據權利要求1所述的一種基于大數據處理的印刷數據識別方法,其特征在于,提取邊緣圖像內閉合的連通域具體包括:對印刷區域中圖案的邊緣使用種子填充法進行連通域分析,得到具有不同標簽的連通域,并得到最大的標簽號的值,即總共的數量。
4.根據權利要求1所述的一種基于大數據處理的印刷數據識別方法,其特征在于,連通域描述組合得到該印刷品圖像的描述具體為:整個圖像的描述表現為
;
同理,對標準圖像重復上述操作,得到標準圖像的圖像描述數據
;
其中為標準圖像中的連通域,為連通域個數。
5.根據權利要求1所述的一種基于大數據處理的印刷數據識別方法,其特征在于,步驟三具體為:遍歷標準圖像和印刷圖像的連通域,將其按照層數L進行分組,并分別計算各個層級對應的個數;比較標準圖像和印刷圖像各個層級的對應個數,個數一致為正常情況,個數不一致的層級需要對該層級內的連通域進一步檢測:設置標準圖像中的對應連通域標志,整體特征值差距;印刷圖像中的對應連通域標志;尋找該層級各連通域之間對應關系:查找印刷圖像某個連通域與標準圖像中各個連通域的整體特征值之間的差值:
差值最小,即時,對相關的兩個連通域即為印刷圖像對應標簽號的對應連通域與標準圖像對應標簽號的對應的連通域;
若標準圖像連通域標志,表示此時的標準圖像中的連通域無對應連通域,更新的值:
;
若標準圖像連通域標志,,表示標準圖像中的該連通域當前在印刷圖像中已存在一個對應連通域,比較該標準圖像連通域的與對應連通域對應的差值的大小:
若, 更新的值,令
;
其中,為對應連通域的連通域標志,為標簽號,為對應連通域的連通域標志;
若,獲得該印刷圖像中的對應連通域與標準圖像連通域的面積差距;獲得對應連通域與標準圖像連通域的面積差距;如果對應連通域對應的面積差距相對于對應連通域的面積差距小,則更新的值;否則不更新的值;
若,則不更新的值;
遍歷結束后,印刷圖像中連通域的對應連通域標志存在兩種情況:;
: 表示該連通域在標準圖像中不存在對應連通域,即缺陷區域,這種缺陷存在的位置為圖案內部和圖案外部空白區域,該區域缺陷的整體影響情況為:
: 在標準圖像中存在對應連通域,比較二者之間的面積差距,由于存在統計誤差,誤差在標準圖像總面積的3%以內均為正常,超過3%的認為存在異常,存在圖案缺印或多印的狀況,則這些區域的缺陷整體影響情況為,表示如下:
印刷圖像整體存在的缺陷為:
。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通天成包裝有限公司,未經南通天成包裝有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111063256.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:排隊長度與交通量估算方法、裝置、設備及可讀存儲介質
- 下一篇:一種變壓器
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





