[發明專利]基于端到端的分布式深度哈希檢索方法有效
| 申請號: | 202110288629.0 | 申請日: | 2021-03-18 |
| 公開(公告)號: | CN112905599B | 公開(公告)日: | 2022-10-14 |
| 發明(設計)人: | 胡海峰;郭偉;吳建盛;朱燕翔 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 秦秋星 |
| 地址: | 210012 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 端到端 分布式 深度 檢索 方法 | ||
1.基于端到端的分布式深度哈希檢索方法,其特征在于包括以下步驟:
步驟1:構建分布式哈希檢索環境,所述分布式哈希檢索環境中包括若干個計算節點以及節點之間的通信鏈路;每個節點網絡都有各自的由帶標記信息的圖片集構成的訓練樣本;節點網絡包括特征提取層、哈希層和輸出層;哈希層與輸出層之間的全連接的參數,稱為全連接層;
步驟2:每個節點采用微調的ResNet網絡架構,并進行參數初始化;所述微調的ResNet網絡架構包括特征提取層、哈希層、輸出層;
步驟3:每個節點用訓練樣本batch進行第一次前向傳播,通過特征提取層得到訓練樣本batch的特征;
步驟4:利用提取到的特征通過哈希層和輸出層,并輸出分類信息;
步驟5:通過交替方向乘子法ADMM優化所有節點ResNet網絡中的全連接層參數,使得ADMM優化后的全連接層參數達到全局最優,并將該參數賦值給每個節點網絡的全連接層;
步驟6:每個節點用與步驟3中同樣的訓練樣本batch通過ResNet網絡進行第二次前向傳播;
步驟7:通過最小化分類誤差和約束哈希碼的目標函數進行訓練,即利用深度學習的反向傳播機制,在固定全連接層參數的情況下,更新ResNet網絡的特征層參數;
步驟8:觀察loss曲線是否收斂,若收斂則訓練完成,反之,重復步驟3-7;
步驟9:訓練完成后,保存模型,并通過模型實現哈希編碼函數,把圖片轉變成哈希碼,將哈希碼保存為數據庫;
步驟10:將需要查詢的圖像輸入到模型中,生成哈希碼,并在數據庫中進行搜索,通過比較哈希碼之間的漢明距離,返回漢明距離最近的圖像,即是需要查找的圖像。
2.根據權利要求1所述的基于端到端的分布式深度哈希檢索方法,其特征在于,步驟1中,不同節點之間的數據集類別相同,但完全獨立,彼此所采用的樣本互有差異。
3.根據權利要求1所述的基于端到端的分布式深度哈希檢索方法,其特征在于,步驟2中,所述參數初始化是利用在ImageNet數據集上預訓練好的ResNet模型對節點網絡進行參數初始化,并將拉格朗日乘子矩陣初始化為全0矩陣。
4.根據權利要求1所述的基于端到端的分布式深度哈希檢索方法,其特征在于,步驟5包括如下步驟:
利用第i個節點中第m個batch圖像的哈希特征及其對應的標簽Yi,m,通過最小化分類誤差,并對每個節點的全連接層參數Wi進行一致性約束,最終得到當前全局最優的全連接層參數W;目標函數及其對應的增廣拉格朗日函數,以及ADMM的迭代步驟如下所示:
目標函數:
s.t.Wi-W=0
增廣拉格朗日函數:
ADMM迭代步驟:
在公式(1-1)中,Wi和bi是指第i個節點的全連接層參數,是指第i個節點中第m個batch圖像的哈希特征,t為哈希特征的維度,n為batch中樣本的數量;為所對應的標簽,c為分類的類別數量,n為batch中樣本的數量;L為交叉熵損失函數,λ為正則化項系數,用于控制正則項的相對重要性,N表示為分布式系統中的節點總數;F為范數,計算方式為矩陣中所有元素的平方和再開根號;在公式(1-2)中,為當前batch全局最優的全連接層參數,t為哈希特征的維度,c為分類的類別數量,ρ為懲罰系數,Λi為拉格朗日乘子,Ui為轉換因子,用來表示ρ和Λi;當優化完所有節點ResNet網絡中的全連接層參數后,得到當前最優的參數W,將該參數賦值給每個節點網絡的全連接層,為第二次前向傳播做準備。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110288629.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種兩輪車停放器
- 下一篇:一種砂炮真空吸運裝置





