[發明專利]基于分布熵增益損失函數的圖像檢索算法有效
| 申請號: | 201910340096.9 | 申請日: | 2019-04-25 |
| 公開(公告)號: | CN110321451B | 公開(公告)日: | 2022-08-05 |
| 發明(設計)人: | 劉萍萍;苗壯;勾貴霞;郭慧俐;石立達;金百鑫;王振;王慧;龔柯 | 申請(專利權)人: | 吉林大學 |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06V10/774;G06V10/82;G06K9/62 |
| 代理公司: | 哈爾濱龍科專利代理有限公司 23206 | 代理人: | 高媛 |
| 地址: | 130012 吉*** | 國省代碼: | 吉林;22 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分布 增益 損失 函數 圖像 檢索 算法 | ||
1.一種基于分布熵增益損失函數的圖像檢索算法,其特征在于所述圖像檢索算法包括如下步驟:
步驟一、構建分布熵增益損失函數:
L=L1+(0.1×L2);
其中,L表示分布熵增益損失函數,L1表示對比損失函數,L2表示特征向量相對熵;
所述對比損失函數公式如下:
其中,f(q)和f(i)表示圖像的特征向量,||f(q)-f(i)||2表示向量f(q)和向量f(i)的歐式距離,r表示負樣本損失函數值的上限,Y(q,i)為1表示匹配,Y(q,i)為0表示不匹配;
步驟二、采用ResNet101和VGG16對卷積神經網絡進行初始化;
步驟三、使用分布熵增益損失函數訓練步驟二初始化得到的網絡,在訓練過程中通過反向傳播調整網絡參數,以得到更加符合圖像檢索需求的網絡模型;
步驟四、對測試集中所有圖像進行多尺度預處理,將預處理之后的多尺度圖像輸入到通過步驟三訓練得到的網絡模型中,通過訓練后的網絡模型提取不同尺度下的圖像特征向量;
步驟五、對不同尺度下的圖像特征向量使用廣義均值池化方法、歸一化處理和學習白化處理得到圖像最終的特征向量;
所述學習白化是在網絡模型訓練結束后利用SfM算法生成訓練集得到學習白化矩陣,使用線性判別投影,白化的訓練步驟如下:
白化部分是類內協方差矩陣的平方根的倒數,計算公式如下:
其中,f(i)和f(j)是圖像的特征向量,Y(i,j)=1表示圖像對匹配,CS表示匹配圖像對的協方差矩陣;
旋轉部分是類間協方差矩陣的特征向量,計算公式如下:
其中,f(i)和f(j)是圖像的特征向量,Y(i,j)=0表示圖像對匹配,CD表示非匹配圖像對的協方差矩陣;
最后將投影應用于其中μ是GeM向量的平均值,用來實現數據中心化;
步驟六、計算查詢圖像和測試集中其他圖像特征向量的歐氏距離,將計算得到的值用來衡量圖像的相似性,并根據相似性得到查詢圖像的檢索序列。
2.根據權利要求1所述的基于分布熵增益損失函數的圖像檢索算法,其特征在于所述特征向量相對熵的計算公式如下:
其中,k表示特征向量的維度,p(xi)和q(xi)表示被比較的圖像對特征向量指定維度數值在特征向量上的頻率分布。
3.根據權利要求2所述的基于分布熵增益損失函數的圖像檢索算法,其特征在于所述p(xi)的計算公式如下:
其中,i表示特征向量的維度編號,k表示特征向量的維度,xi表示特征向量上第i維上的值。
4.根據權利要求1所述的基于分布熵增益損失函數的圖像檢索算法,其特征在于所述步驟一中,訓練網絡時采用的訓練集是通過SfM算法得到的,在訓練網絡時,訓練集數據以元組(q,m(q),N(q))的形式呈現,其中q是查詢圖像,m(q)是與查詢匹配的圖像,N(q)表示與查詢不匹配的圖像。
5.根據權利要求1所述的基于分布熵增益損失函數的圖像檢索算法,其特征在于所述廣義均值池化的計算公式如下:
其中,k表示特征向量的維度,pk是指數,Xk是維度為k的特征圖,||X||是特征圖X的像素值個數,x表示特征圖中的像素值。
6.根據權利要求1所述的基于分布熵增益損失函數的圖像檢索算法,其特征在于所述歐氏距離計算公式如下:
其中,f(i)表示圖像i輸入網絡模型后輸出的特征向量,f(j)表示圖像j輸入網絡模型后輸出的特征向量,||f(i)-f(j)||2表示特征向量f(i)和特征向量f(j)每一維值差的平方和。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910340096.9/1.html,轉載請聲明來源鉆瓜專利網。





