[發明專利]基于多任務深度哈希學習的大規模物流商品圖像檢索方法有效
| 申請號: | 202110732492.3 | 申請日: | 2021-06-29 |
| 公開(公告)號: | CN113377981B | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 聶秀山;王樂天;劉興波;王少華 | 申請(專利權)人: | 山東建筑大學 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53 |
| 代理公司: | 濟南泉城專利商標事務所 37218 | 代理人: | 支文彬 |
| 地址: | 250101 山東省濟*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 任務 深度 學習 大規模 物流 商品 圖像 檢索 方法 | ||
1.一種基于多任務深度哈希學習的大規模物流商品圖像檢索方法,其特征在于,包括如下步驟:
a)對輸入的物流商品圖像xi進行圖像預處理,根據圖像xi的標簽構建物流商品圖像之間的相似度矩陣S;
b)將預處理后的物流商品圖像經過卷積、池化處理后得到圖像的一維特征向量himg,將一維特征向量himg作為圖像低級特征;
c)將圖像低級特征himg輸入多分支的網絡中得到多個長度哈希碼表示的圖像的高級表征Bk,多分支網絡由N個相同結構的分支組成;
d)通過公式計算相似度損失函數SILoss,sij為第i張圖像與第j張圖像之間的相似度,sij∈{1,0},sij取值為1時表示第i張圖像與第j張圖像相似,sij取值為0時表示第i張圖像與第j張圖像不相似,bi為第i張圖像數據的二值哈希碼,bj為第j張圖像數據的二值哈希碼,T為轉置;
e)通過公式計算互信息損失函數MILoss,式中Bk為第k個分支輸出的哈希碼,k∈0,...,N-1,Bk+1為第k+1個分支輸出的哈希碼,Wk為將第k個分支輸出的哈希碼映射到第k+1個分支輸出的哈希碼的映射矩陣,γk為正則化參數,||·||1為L1范數,ak為優化參數;
f)利用隨機梯度下降算法對相似度損失函數SILoss和互信息損失函數MILoss進行優化,優化后重復執行步驟a)至步驟e)大于等于M次,得到訓練后的模型;
g)將數據庫中的圖像數據輸入到步驟f)中訓練后的模型中,得到每張圖像的不同長度的二值哈希碼表示組合Bdatabase;
h)將需要檢索的圖片imgquery輸入到步驟f)中訓練后的模型中,得到需要檢索圖片imgquery的二值哈希碼表示組合Bquery;
i)通過公式計算漢明距離DistHamming,將計算得到的漢明距離DistHamming基于Average Precision的度量方式返回所有檢索圖片查詢集的平均檢索精度Mean Average Precision,完成相似性檢索。
2.根據權利要求1所述的基于多任務深度哈希學習的大規模物流商品圖像檢索方法,其特征在于:步驟b)中有5個卷積層,每個卷積層后接入一個池化層,所述卷積層采用3*3大小的卷積核,所述池化層采用2*2大小的池化核,所述卷積層和池化層均采用Relu激活函數。
3.根據權利要求1所述的基于多任務深度哈希學習的大規模物流商品圖像檢索方法,其特征在于:步驟c)中多分支網絡由N個相同結構的分支組成,每個分支內部由3層全連接層相互串聯構成。
4.根據權利要求1所述的基于多任務深度哈希學習的大規模物流商品圖像檢索方法,其特征在于:步驟c)中N取值為大于0的正整數。
5.根據權利要求1所述的基于多任務深度哈希學習的大規模物流商品圖像檢索方法,其特征在于:步驟f)中M取值為5000。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東建筑大學,未經山東建筑大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110732492.3/1.html,轉載請聲明來源鉆瓜專利網。





