[發明專利]一種基于哈希編碼的印花織物圖像檢索方法有效
| 申請號: | 201810651428.0 | 申請日: | 2018-06-22 |
| 公開(公告)號: | CN108984642B | 公開(公告)日: | 2021-07-27 |
| 發明(設計)人: | 景軍鋒;王妙;李鵬飛;蘇澤斌;張緩緩;張蕾;張宏偉 | 申請(專利權)人: | 西安工程大學 |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06K9/62 |
| 代理公司: | 西安弘理專利事務所 61214 | 代理人: | 曾慶喜 |
| 地址: | 710048 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 編碼 印花 織物 圖像 檢索 方法 | ||
1.一種基于哈希編碼的印花織物圖像檢索方法,其特征在于,具體按照以下步驟實施:
步驟1,在ImageNet數據集上進行有監督訓練,得到預訓練模型,即AlexNet網絡;
步驟2,建立印花織物數據庫,并批量進行預處理;
步驟3,對經步驟1后得到的AlexNet網絡進行修改;具體為:
在AlexNet網絡的最后一個全連接層fc8和倒數第二個全連接層fc7之間加入哈希層,激活函數選用Sigmoid,并將原始的第一和第二卷基層后的LRN局部響應歸一化改為BatchNorm批量歸一化;
BatchNorm歸一化的計算公式,如式(2)所示:
步驟4,利用步驟2中建立的印花織物數據庫對經步驟3后得到的AlexNet網絡進行fine-tuning;具體按照以下步驟實施:
步驟4.1,將修改后的AlexNet網絡模型輸入數據Source及均值路徑mean_file改為步驟2中得到的文件路徑;
第一卷積層、第二卷積層進行卷積操作后依次進行歸一化、ReLU激活及池化操作,第三卷積層和第四卷積層進行卷積操作后進行ReLU激活操作,第五卷積層進行卷積操作后進行ReLU激活及池化操作,最后一層全連接層進行卷積操作后依次進行了Accuracy和Softmax-loss操作;
其中,ReLU激活采用的激活函數為f(x)=max(x,0);
池化方法采用max最大池化法,計算方法,如式(3)及式(4)所示:
w1=(w0+2*pad-ker nel_size)/stride+1 (3);
h1=(h0+2*pad-ker nel_size)/stride+1 (4);
式(3)及式(4)中,pad為邊緣擴充默認為0,kernel_size為池化的核大小,設置為3,步長stride為2;w0、h0為輸入的特征圖寬度和高度,w1、h1則是池化后的寬度和高度;
步驟4.2,修改solver.prototxt中的訓練參數,設置合適的基礎學習率,并選用NAG代替SGD進行權值更新;
步驟4.3,隨機提取圖像227*227的子塊或鏡像輸入到經步驟4.1后得到修改后的AlexNet網絡中,復用AlexNet模型的前7層權重做fine-tuning,得到第7層、第8層和output層之間的權重;
步驟5,利用步驟4中fine-tuning得到的網絡模型提取每張圖像的哈希二值編碼,計算查詢圖像與數據庫圖像二值哈希編碼之間的漢明距離,得到與查詢圖像最相似的m個池內圖像;
步驟6,計算池內m個圖像與查詢圖像fc7層特征向量之間的歐式距離,將圖像數據庫中的圖像按歐式距離由小到大排列,提取出與最小歐式距離相對應的幾幅圖像,即為要檢索的相似度最高的top k圖像。
2.根據權利要求1所述的一種基于哈希編碼的印花織物圖像檢索方法,其特征在于,所述步驟1中,AlexNet網絡,包括五個卷積層和三個全連接層,第一卷積層Conv1、第二卷積層Conv2、第三卷積層Conv3、第四卷積層Conv4和第五卷積層Conv5,第六全連接層fc6、第七全連接層fc7和第八全連接層fc8,并且第一卷積層至第五卷積層直接依次級聯,第六全連接層至第八全連接層直接依次級聯,第六全連接層直接連接到第五卷積層上;第一卷積層至第五卷積層為特征提取層,第六全連接層至第八全連接層為特征融合層和分類層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安工程大學,未經西安工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810651428.0/1.html,轉載請聲明來源鉆瓜專利網。





