[發(fā)明專利]應用于圖像檢索的半監(jiān)督哈希學習方法及裝置有效
| 申請?zhí)枺?/td> | 201910022866.5 | 申請日: | 2019-01-10 |
| 公開(公告)號: | CN109766463B | 公開(公告)日: | 2021-03-12 |
| 發(fā)明(設(shè)計)人: | 張世楓;李建民;張鈸 | 申請(專利權(quán))人: | 清華大學 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51 |
| 代理公司: | 北京林達劉知識產(chǎn)權(quán)代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 應用于 圖像 檢索 監(jiān)督 學習方法 裝置 | ||
本公開涉及半監(jiān)督哈希學習方法及裝置,所述方法包括:將樣本數(shù)據(jù)輸入教師函數(shù)進行處理,得到教師函數(shù)輸出哈希碼,將樣本數(shù)據(jù)輸入學生函數(shù)進行處理,得到學生函數(shù)輸出哈希碼;根據(jù)樣本數(shù)據(jù)、教師函數(shù)輸出哈希碼和學生函數(shù)輸出哈希碼確定學生函數(shù)的損失;向?qū)W生函數(shù)反向傳播損失的梯度,以調(diào)整學生函數(shù)的參數(shù),完成學生函數(shù)的一次訓練;根據(jù)調(diào)整后的學生函數(shù)的參數(shù)和待調(diào)整的所述教師函數(shù)的參數(shù),確定調(diào)整后的教師函數(shù)的參數(shù),完成教師函數(shù)的一次訓練。本公開實施例可以使用少數(shù)有標注樣本數(shù)據(jù)和大量無標注樣本數(shù)據(jù)進行訓練。教師函數(shù)和學生函數(shù)進行聯(lián)合訓練得到的教師函數(shù)和學生函數(shù)可以用于高效、準確地得到數(shù)據(jù)的哈希碼,以用于更加高效的檢索。
技術(shù)領(lǐng)域
本公開涉及神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種半監(jiān)督哈希學習方法及裝置。
背景技術(shù)
伴隨著人工智能和信息檢索技術(shù)的發(fā)展,圖像等復雜數(shù)據(jù)的檢索需求越來越多。以圖像檢索為例,給定一張圖像,我們希望找到像素或語義級別相似的圖片。由于圖像結(jié)構(gòu)復雜且維度高,圖像檢索的效率及準確率成為大規(guī)模圖像數(shù)據(jù)的難點。
深度哈希學習方法是傳統(tǒng)的大規(guī)模復雜數(shù)據(jù)(如圖像等)檢索的解決方法。哈希學習可以學習特定的哈希函數(shù),將高維復雜數(shù)據(jù)映射到短的二值哈希碼,使得相似的數(shù)據(jù)(如圖像像素相似或者語義相似)的哈希碼的漢明距離較小。伴隨深度學習技術(shù)的發(fā)展,可以利用深度神經(jīng)網(wǎng)絡(luò)提取復雜數(shù)據(jù)的向量特征。深度哈希學習可以將深度神經(jīng)網(wǎng)絡(luò)作為待學習的哈希函數(shù),進行哈希學習的同時學習深度神經(jīng)網(wǎng)絡(luò),并且用深度神經(jīng)網(wǎng)絡(luò)提取復雜數(shù)據(jù)的哈希碼。哈希碼存儲了數(shù)據(jù)的語義信息,同時也可以用于大規(guī)模復雜數(shù)據(jù)檢索。
現(xiàn)有深度哈希學習的基礎(chǔ)在于大量有標注的數(shù)據(jù),即每個數(shù)據(jù)有一個類別標簽。但在實際應用中,數(shù)據(jù)規(guī)模巨大(如圖片達到上億級別),人工標注這些數(shù)據(jù)用于訓練需要耗費大量人力財力,幾乎不可能;其次,數(shù)據(jù)標注可能是數(shù)據(jù)對之間的關(guān)系,如社交網(wǎng)絡(luò)的好友關(guān)系,圖像文字描述定義的關(guān)系等,導致直接標注數(shù)據(jù)類別并不可取。以上問題,均導致深度哈希學習的效果不理想。
發(fā)明內(nèi)容
有鑒于此,本公開提出了一種半監(jiān)督哈希學習方法,所述方法包括:
將樣本數(shù)據(jù)輸入教師函數(shù)進行處理,得到教師函數(shù)輸出哈希碼,將所述樣本數(shù)據(jù)輸入學生函數(shù)進行處理,得到學生函數(shù)輸出哈希碼;
根據(jù)所述樣本數(shù)據(jù)、所述教師函數(shù)輸出哈希碼和所述學生函數(shù)輸出哈希碼確定所述學生函數(shù)的損失;
向所述學生函數(shù)反向傳播所述損失的梯度,以調(diào)整所述學生函數(shù)的參數(shù),完成所述學生函數(shù)的一次訓練;
根據(jù)調(diào)整后的所述學生函數(shù)的參數(shù)和待調(diào)整的所述教師函數(shù)的參數(shù),確定調(diào)整后的所述教師函數(shù)的參數(shù),完成所述教師函數(shù)的一次訓練。
在一種可能的實現(xiàn)方式中,所述根據(jù)所述樣本數(shù)據(jù)、所述教師函數(shù)輸出哈希碼和所述學生函數(shù)輸出哈希碼確定所述學生函數(shù)的損失,包括:
根據(jù)所述樣本數(shù)據(jù)、所述教師函數(shù)輸出哈希碼和所述學生函數(shù)輸出哈希碼,確定二元相似度損失、一致漢明距離損失和量化錯誤損失;
根據(jù)所述二元相似度損失、所述一致漢明距離損失和所述量化錯誤損失確定所述學生函數(shù)的損失。
在一種可能的實現(xiàn)方式中,所述樣本數(shù)據(jù)包括第一樣本數(shù)據(jù)和第二樣本數(shù)據(jù),所述根據(jù)所述樣本數(shù)據(jù)、所述教師函數(shù)輸出哈希碼和所述學生函數(shù)輸出哈希碼,確定二元相似度損失、一致漢明距離損失和量化錯誤損失,包括:
根據(jù)所述第一樣本數(shù)據(jù)和所述第二樣本數(shù)據(jù)的相似度、所述教師函數(shù)輸出哈希碼和所述學生函數(shù)輸出哈希碼,利用二元相似度損失函數(shù)確定所述二元相似度損失。
在一種可能的實現(xiàn)方式中,所述樣本數(shù)據(jù)包括第一樣本數(shù)據(jù)和第二樣本數(shù)據(jù),所述將樣本數(shù)據(jù)輸入教師函數(shù)進行處理,得到教師函數(shù)輸出哈希碼,將所述樣本數(shù)據(jù)輸入學生函數(shù)進行處理,得到學生函數(shù)輸出哈希碼,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學,未經(jīng)清華大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910022866.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 在即時通信中提供即時監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學習的標簽比例學習模型的訓練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對象尋址方法、電子設(shè)備及存儲介質(zhì)
- 一種機器人表情調(diào)用方法和家用機器人
- 計算機視覺訓練系統(tǒng)和用于訓練計算機視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





