[發明專利]基于深度哈希網絡的鑄件缺陷圖像檢測方法在審
| 申請號: | 201810766116.4 | 申請日: | 2018-07-12 |
| 公開(公告)號: | CN108986091A | 公開(公告)日: | 2018-12-11 |
| 發明(設計)人: | 孫志毅;楊凱;王安紅;劉瑞珍;吳賀賀 | 申請(專利權)人: | 太原科技大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06K9/62 |
| 代理公司: | 北京國坤專利代理事務所(普通合伙) 11491 | 代理人: | 趙紅霞 |
| 地址: | 030024 山*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輸入圖像 迭代 預處理 卷積神經網絡 哈希網絡 圖像檢測 鑄件缺陷 連接層 池化 哈希 材料鑄件 分類結果 檢測領域 缺陷圖像 圖像分類 圖像輸入 圖像特征 網絡模型 訓練網絡 輸出 初始化 數據集 正確率 卷積 網絡 圖像 測試 分類 概率 | ||
1.一種基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征是包括下列步驟:
a、在ImageNet上預訓練一個卷積神經網絡;
b、輸入圖像,并對輸入圖像進行預處理;
c、已預處理的圖像開始進入深度哈希網絡的第一個卷積層,并將第一個卷積層的輸出結果進行max-pooling運算;
d、上一層的輸出結果進入第二個卷積層,并將第二個卷積層的輸出結果進行max-pooling運算;
e、上一層的輸出結果進入第三個卷積層,進行卷積運算,將第三層的輸出結果輸入第四個卷積層,再進行卷積運算
f、上一層的輸出結果進入第五個卷積層,并將第五個卷積層的輸出結果進行max-pooling運算;
g、上一層的輸出結果進入深度哈希網絡的兩個全連接層;
h、上一層的輸出結果進入深度哈希網絡的哈希層;
i、上一層的輸出結果進入深度哈希網絡的最后一層,得到圖像屬于有缺陷與無缺陷兩個類別的概率,得出圖像分類結果。
2.根據權利要求1所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟a中,所述預訓練一個卷積神經網絡的方法是基于AlexNet圖像分類網絡,使用此框架在ImageNet上訓練網絡,得到的網絡參數用于訓練特定材料鑄件圖像深度哈希網絡的初始參數。
3.根據權利要求1所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟b中,網絡訓練開始之前,網絡會計算產生一個均值文件,對于訓練集中的每副圖像,在進入網絡后會在每一個像素點上減去這個全局均值。進入網絡訓練的圖像,會隨機裁剪成227×227的碎片。
4.根據權利要求1所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟c-h中,網絡的進程可以表示成從網絡的上一層到網絡下一層的一種非線性關系:其中是對于輸入圖像經過第p層的圖像特征輸出,Wp和bp分別是第p層的權重和偏置項,fp是ReLu激活函數,其表達式為fp(x)=max(0,x),其中x表示卷積層和全連接層的輸出,每一層卷積和全連接層都使用ReLu激活函數,但是在第一層和第二層的ReLu前要進行局部響應歸一化操作。
5.根據權利要求4所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟c、d中,在使用激活函數之前要進行局部響應歸一化LRN,活性定義為:其中∑(...)表示在相同空間位置上轉換n個相鄰的核映射,N是該層中核的總數,k,n,α,和β是超參數,表示在位置(x,y)處的像素點通過應用核計算出的神經元激活度。
6.根據權利要求1或5所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟c、d和f中,池化運算是在第一個LRN,第二個LRN以及第5層卷積后進行的,采用的方式為最大值池化。
7.根據權利要求1所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟g中,全連接層中采用dropout技術,作用是按0.5的概率使得這兩層中每個神經元的輸出為0,去除的神經元不參與網絡的前向與反向轉播。輸入的圖像在不斷變化,神經網絡就會有不同的結構,但是這些結構之間的權值是共享的。
8.根據權利要求1所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟h中,哈希層的激活函數為sigmiod,假設二進制碼的長度為k,它的表達式為:其中hi是哈希層的圖像特征向量輸出,β是超參數。
9.根據權利要求8所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟h中,哈希層的輸出為二進制編碼,二進制編碼通過一個閾值函數,二進制碼的長度為k,其表達式為
10.根據權利要求8所述的基于深度哈希網絡的鑄件缺陷圖像檢測方法,其特征在于,步驟h中,哈希層采用了一種分塊模型,假設哈希層輸出的圖像特征向量為m,將圖像特征向量分為k個塊,每塊包含向量維數為m/k,其中m是k的倍數,其中特征向量的尺寸可以通過控制第7層全連接層的輸出單元數量來確定,然后通過一個全連接層將每塊映射成一維數字,再通過sigmoid函數將輸出限制在[0,1]范圍內,最后將這些值經過閾值函數生成緊湊簡潔的二進制碼。假設給定訓練數據為A={A1,A2,...,An},每個數據都有一個屬于該類別的標簽,經過哈希層后可以得到它們的哈希碼AH={H1,H2,...,Hn},對于一個待測試圖像Aq,經過哈希層后其哈希編碼為Hq,如果Hq與Hi的漢明距離小于設定的閾值,此時可以得到與Aq相關的數據集此時在歐幾里得空間中,通過比較每張圖像的最后一層全連接輸出的特征向量來確定測試圖像和相關數據集S中哪張圖像最相近,Vq和ViS分別表示圖像Aq和從網絡第7層輸出的特征向量,定義歐幾里得距離ei=||Vq-ViS||.,ei的值越小,說明兩張圖像的相似性越高,然后再參照兩張圖像是否有相同的標簽信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原科技大學,未經太原科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810766116.4/1.html,轉載請聲明來源鉆瓜專利網。





