[發明專利]一種基于深度學習的瓦楞紙板堆疊層數計數方法在審
| 申請號: | 202010740901.X | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111862122A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 張堃;韓宇;徐子洋;榮夢杰;馮文宇;華亮;李文俊;鮑毅 | 申請(專利權)人: | 南通大學;杭州博拉哲科技有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T5/40;G06N3/08;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 226019 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 瓦楞紙板 堆疊 層數 計數 方法 | ||
1.一種基于深度學習的瓦楞紙板堆疊層數計數方法,其特征在于:包括以下步驟:
A、對紙板堆疊照片截取感興趣區域并進行圖像預處理:首先從原始紙板堆疊照片中截取感興趣區域,其具體步驟為:首先對一張紙板堆疊照片截取紙板大孔洞區域,作為模板圖像,然后通過OpenCV圖像模板進行匹配,從待截取圖像的左上角開始截取一塊臨時圖像,將截取的臨時圖像與模板圖像進行匹配,記錄匹配結果,重復該操作直到截取至圖像的右下角;其中,匹配結果最好的臨時圖像即為感興趣區域;
然后將所截取的感興趣區域變換為灰度圖像,并對其采用直方圖均衡化處理以增強紙板大孔洞區域與背景區域的對比度,對圖像進行直方圖均衡化的變換表示如下:
其中,Hr(rj)為圖像的灰度直方圖,k為進行均衡化變換前圖像的灰度級總數,rk表示圖像直方圖均衡化變換前的灰度值,T為直方圖均衡化變換函數,sk為直方圖均衡化變換后的灰度值,nj為直方圖均衡化變換后圖像中灰度值為j的像素個數,n為圖像的像素數;
B、將步驟A得到的預處理后的圖像作為輸入,搭建AA R2U-Net模型;
C、對步驟B得到的AA R2U-Net進行訓練;
D、加載步驟三得到的訓練后的AA R2U-Net對紙板堆疊照片進行紙板大孔洞分割并對瓦楞紙板堆疊層數進行計數。
2.根據權利要求1所述的一種基于深度學習的瓦楞紙板堆疊層數計數方法,其特征在于:所述步驟B包括:在Unet中加入了R2模塊與Attention Augment模塊;其中,Unet結構總體呈對稱的U型結構,在設計時共包含12個單元(F1-F12),其中左側F1-F6為收縮路徑,用于特征的提取;右側F6-F12為擴張路徑,用于細節的恢復實現精準預測;R2模塊包括了殘差學習單元和遞歸卷積。
3.根據權利要求2所述的一種基于深度學習的瓦楞紙板堆疊層數計數方法,其特征在于:所述R2模塊包括了殘差學習單元和遞歸卷積,
(1)殘差學習單元:假定一個神經網絡單元的輸入是x,期望輸出是H(x),另外定義一個殘差映射F(x)=H(x)-x,若把x直接傳遞給輸出,則該神經網絡單元要學習的目標就是殘差映射F(x)=H(x)-x,殘差學習單元由一系列卷積層和一個捷徑組成,輸入x通過這個捷徑傳遞給殘差學習單元的輸出,則殘差學習單元的輸出為z=F(x)+x;
(2)遞歸卷積:假定輸入為x,對該輸入x進行連續的卷積,且每一次的卷積輸出加上當前的輸入作為下一次的卷積的輸入;
R2模塊即將殘差學習單元中的普通卷積替換為遞歸卷積。
4.根據權利要求2所述的一種基于深度學習的瓦楞紙板堆疊層數計數方法,其特征在于:所述Attention Augment本質為通過查詢得到一系列鍵-值對的映射;首先,通過對輸入大小為(w,h,cin)的特征圖進行1×1卷積輸出QKV矩陣,其大小為(w,h,2*dk+dv),其中w、h、2*dk+dV分別表示了矩陣的寬、長與深度;再從深度通道上對QKV矩陣進行分割,得到Q、K、V三個矩陣其深度通道大小分別為dk、dk、dv;接著,采用了多頭注意力機制的結構,將Q、K、V三個矩陣分別從深度通道上分割為N個相等的矩陣進行后續的計算,這種多頭注意力機制將原本單一的attention計算,擴展為較小且并行獨立的多個計算,使得模型可以在不同的子空間內學習特征信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南通大學;杭州博拉哲科技有限公司,未經南通大學;杭州博拉哲科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010740901.X/1.html,轉載請聲明來源鉆瓜專利網。





