[發(fā)明專利]一種圖像檢索模型、訓(xùn)練方法在審
| 申請?zhí)枺?/td> | 202110365966.5 | 申請日: | 2021-04-06 |
| 公開(公告)號: | CN113326864A | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計)人: | 王建;張智超;宋巍;黃冬梅;趙丹楓;鄭小羅 | 申請(專利權(quán))人: | 上海海洋大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 上海伯瑞杰知識產(chǎn)權(quán)代理有限公司 31227 | 代理人: | 孟旭彤 |
| 地址: | 201306 上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖像 檢索 模型 訓(xùn)練 方法 | ||
一種圖像檢索模型訓(xùn)練方法,該模型的損失函數(shù)其中,m是全部樣本的數(shù)量;P為正樣本對集合;Pi為第i個樣本作查詢樣本時,正樣本對的集合;N為負(fù)樣本對集合;Ni為第i個樣本作查詢樣本時,負(fù)樣本對的集合;n為選擇的負(fù)樣本對數(shù)量;δ為負(fù)樣本對相似度從高到底排序的順序(1?n);r為閾值參數(shù),代表對負(fù)樣本對優(yōu)化的權(quán)重;λ、d為閾值參數(shù),共同表示將正負(fù)樣本拉開的距離;S表示相似度;Sik表示第i個樣本和第k的樣本的相似度;α、β為閾值參數(shù),分別代表對正樣本對損失的權(quán)重和對負(fù)樣本對損失的權(quán)重。
技術(shù)領(lǐng)域
本發(fā)明屬于人工智能技術(shù)領(lǐng)域,特別涉及一種圖像檢索模型、訓(xùn)練方法。
背景技術(shù)
對于圖像檢索識別領(lǐng)域,設(shè)計一個有效的相似性度量是提高視覺分析系統(tǒng)性能的關(guān)鍵。現(xiàn)有文獻(xiàn)中提出了大量的損失函數(shù),如對比度損失[1]、三重線損失[2]、四線損失[3]、提升結(jié)構(gòu)損失[4]、N對損失[5]、基于距離加權(quán)余量的損失[6]、三重線中心損耗[7]、二項(xiàng)式偏離損耗[8]、直方圖損失[9]、角度損失[10]、多重相似性損失[11],對于這種基于對的損耗,將樣本分為正對和負(fù)對,它們都從樣本中提取信息,以縮短正對之間的距離,從而將負(fù)樣本推開。
對比損失:基于成對數(shù)據(jù),對比損失旨在最小化正對之間的距離,同時懲罰負(fù)對之間的距離小于預(yù)定義的裕度m。對比損失只挖掘距離小于m的負(fù)對,并為所有選擇的對分配相等的權(quán)重。
三重態(tài)損耗:基于三重態(tài)數(shù)據(jù),設(shè)計了三重態(tài)損耗,使三重態(tài)中正對的距離比負(fù)對的距離小一個裕度m。具體地說,三元組損失挖掘出合適的樣本,形成信息豐富的三元組,并為所有選擇的對分配相等的權(quán)重。
N對損耗:三重態(tài)損耗同時拉一個正樣本,同時推一個負(fù)樣本。為了通過與更多的負(fù)類和樣本的相互作用來提高三重態(tài)的損失,設(shè)計了N對損失來從N-1類的N-1個負(fù)樣本(每個類一個負(fù)樣本)中識別出一個正樣本。具體地說,N對損失挖掘信息樣本時,每類隨機(jī)抽取一個正對,形成N對,然后利用N對之間的多類關(guān)系進(jìn)行挖掘。然后它為三重態(tài)中的正負(fù)對分配相等的權(quán)重。
提升結(jié)構(gòu)損失:不再只使用每一類的一個負(fù)樣本,而是將所有的負(fù)樣本納入訓(xùn)練小批量中。對于每一個正樣本對,提升結(jié)構(gòu)化損失的目標(biāo)是拉得盡可能近,并將對應(yīng)的所有負(fù)樣本推遠(yuǎn)到一個裕度m。給定一個查詢樣本,提升結(jié)構(gòu)化損失打算在小批量中從所有對應(yīng)的負(fù)樣本中識別出一個正樣本,以充分探索結(jié)構(gòu)關(guān)系。具體來說,提升結(jié)構(gòu)損耗利用所有的負(fù)樣本,挖掘信息樣本,使鉸鏈函數(shù)返回非零值。然后對于正對,提升結(jié)構(gòu)損失分配權(quán)重,而為每個負(fù)對分配不同的權(quán)重。
多重相似性損失:在提升結(jié)構(gòu)損失的基礎(chǔ)上,通過更廣義的加權(quán)策略,設(shè)計多相似度損失,充分利用正負(fù)對。首先,通過預(yù)先設(shè)定的閾值,采用三元組準(zhǔn)則挖掘信息對:對距離大于最小負(fù)對最小距離的正對進(jìn)行采樣,對距離小于正對最大距離加閾值的負(fù)對進(jìn)行采樣。具體地說,多相似性損失通過對正、負(fù)對的三元組準(zhǔn)則挖掘信息對,然后分別為正對和負(fù)對分配不同的權(quán)重。
本文涉及的參考文獻(xiàn)包括:
[1]R.Hadsell,S.Chopra,and Y.LeCun,“Dimensionality Reduction byLearning an Invariant Mapping,”in 2006IEEE Computer Society Conference onComputer Vision and Pattern Recognition-Volume 2(CVPR’06),New York,NY,USA,2006, vol.2,pp.1735–1742,doi:10.1109/CVPR.2006.100.
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海海洋大學(xué),未經(jīng)上海海洋大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110365966.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





