[發(fā)明專利]基于深度學(xué)習(xí)和哈希的圖像檢索方法有效
| 申請(qǐng)?zhí)枺?/td> | 201510901348.2 | 申請(qǐng)日: | 2015-12-07 |
| 公開(公告)號(hào): | CN105512289B | 公開(公告)日: | 2018-08-14 |
| 發(fā)明(設(shè)計(jì))人: | 張晨民;趙慧琴;彭天強(qiáng) | 申請(qǐng)(專利權(quán))人: | 鄭州金惠計(jì)算機(jī)系統(tǒng)工程有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 鄭州大通專利商標(biāo)代理有限公司 41111 | 代理人: | 陳大通 |
| 地址: | 450000 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 哈希函數(shù) 圖像檢索 量化誤差 哈希 卷積神經(jīng)網(wǎng)絡(luò) 準(zhǔn)確率 圖像底層特征 內(nèi)在關(guān)系 深度特征 特征表達(dá) 提取圖像 圖像特征 學(xué)習(xí)能力 二值化 分類器 哈希碼 學(xué)習(xí) 檢索 圖像 挖掘 引入 | ||
本發(fā)明涉及一種基于深度學(xué)習(xí)和哈希的圖像檢索方法,利用深度卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的學(xué)習(xí)能力,提取圖像深層特征,克服現(xiàn)有技術(shù)中利用圖像底層特征而導(dǎo)致特征表達(dá)能力不強(qiáng)、檢索精度低的問題;并引入哈希層構(gòu)造哈希函數(shù),將圖像深度特征的學(xué)習(xí)和哈希函數(shù)的構(gòu)造在同一過程中完成,挖掘圖像特征與哈希函數(shù)內(nèi)在關(guān)系,大大提高圖像檢索準(zhǔn)確率;將量化誤差的損失加入到深度卷積神經(jīng)網(wǎng)絡(luò)的損失層,增強(qiáng)了哈希碼的表達(dá)能力,通過Softmax分類器損失模塊和量化誤差損失模塊,有效降低哈希函數(shù)中的二值化造成的量化誤差,進(jìn)一步提高圖像檢索的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像檢索領(lǐng)域,特別涉及一種基于深度學(xué)習(xí)和哈希的圖像檢索方法。
背景技術(shù)
隨著大數(shù)據(jù)時(shí)代的到來,互聯(lián)網(wǎng)圖像資源迅猛增長(zhǎng),如何對(duì)大規(guī)模圖像資源進(jìn)行快速有效地檢索以滿足用戶需求亟待解決。為了在大規(guī)模圖像集中進(jìn)行快速有效地檢索,哈希技術(shù)將原始圖像保持相似性地映射為二進(jìn)制哈希碼。由于二進(jìn)制哈希碼在漢明距離計(jì)算上的高效性和存儲(chǔ)空間上的優(yōu)勢(shì),哈希碼在大規(guī)模圖像檢索非常地高效。基于內(nèi)容的圖像檢索通過提取圖像視覺底層特征來實(shí)現(xiàn)圖像的內(nèi)容表達(dá)。與這些底層特征相比,深度卷積神經(jīng)網(wǎng)絡(luò)更能夠獲得圖像的內(nèi)在特征,利用深度卷積神經(jīng)網(wǎng)絡(luò)提取的特征在目標(biāo)檢測(cè)、圖像分類和圖像分割等方面都表現(xiàn)出了良好的性能。中國專利(申請(qǐng)?zhí)枺?01010196539.0,公開號(hào):CN101894130A)提出的公開了一種基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法,首先提取圖像底層特征,進(jìn)一步通過聚類得到視覺單詞,然后利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐式空間到漢明空間的映射函數(shù),得到低維空間漢明向量,該方法哈希函數(shù)的構(gòu)造假設(shè)訓(xùn)練數(shù)據(jù)服從均勻分布,使其應(yīng)用受限;又如中國專利(申請(qǐng)?zhí)枺?01410441091.2,公開號(hào):CN104182538A)公開了一種基于半監(jiān)督哈希的圖像檢索方法,首先提取原始圖像的底層特征,使用類標(biāo)傳遞方法求訓(xùn)練數(shù)據(jù)的類標(biāo),根據(jù)類標(biāo)產(chǎn)生編碼;然后使用訓(xùn)練數(shù)據(jù)及其編碼訓(xùn)練支持向量機(jī)分類器,最后數(shù)據(jù)根據(jù)支持向量機(jī)分類器的分類產(chǎn)生哈希編碼,該方法中哈希構(gòu)造算法對(duì)數(shù)據(jù)的分布沒有要求,且檢索精度有所提高,但它仍舊將圖像特征提取和哈希函數(shù)的構(gòu)造過程分為完全獨(dú)立的兩個(gè)過程,不能得到很好的哈希碼表示圖像,其檢索精確度有待進(jìn)一步的提高。Kevin Lin等在文章“DeepLearning of Binary Hash Codes for Fast Image Retrieval”中提出了一種利用深度卷積網(wǎng)絡(luò)框架同時(shí)學(xué)習(xí)特征和哈希函數(shù)的算法,該文章中采用類別標(biāo)簽作為監(jiān)督信息。該方法的不足之處是:它沒有考慮到將連續(xù)值閾值化為哈希碼時(shí)產(chǎn)生的量化誤差,從而使得檢索精度降低。
現(xiàn)有的基于哈希的圖像檢索技術(shù)基本上都是首先提取圖像底層特征,然后構(gòu)造保持圖像特征相似性的哈希函數(shù);最后,利用哈希函數(shù)將底層特征圖像特征映射為哈希碼,用哈希碼表示圖像用于大規(guī)模的圖像檢索,以發(fā)揮哈希碼在存儲(chǔ)空間少和漢明距離計(jì)算速度快的優(yōu)勢(shì),將圖像特征提取和哈希函數(shù)的構(gòu)造過程分為完全獨(dú)立的兩個(gè)過程,不能構(gòu)造出表達(dá)能力強(qiáng)哈希碼表示圖像,使得檢索準(zhǔn)確率低。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中的不足,本發(fā)明提供一種基于深度學(xué)習(xí)和哈希的圖像檢索方法,同時(shí)學(xué)習(xí)圖像特征和哈希編碼的深度卷積網(wǎng)絡(luò)架構(gòu),在該架構(gòu)中加入哈希層和將連續(xù)值量化為二進(jìn)制編碼所引起的量化誤差損失,利用該架構(gòu)生成表達(dá)能力非常強(qiáng)的哈希碼,大大提高圖像檢索的準(zhǔn)確率,解決現(xiàn)有技術(shù)中因生成的哈希碼表達(dá)能力不強(qiáng)而引起檢索準(zhǔn)確率較低的問題。
按照本發(fā)明所提供的設(shè)計(jì)方案,一種基于深度學(xué)習(xí)和哈希的圖像檢索方法,具體包含如下步驟:
步驟1.將圖像數(shù)據(jù)集及其對(duì)應(yīng)的類別標(biāo)簽信息分別對(duì)應(yīng)分成兩部分,一部分作為訓(xùn)練樣本集,另一部分作為測(cè)試樣本集,其中,訓(xùn)練樣本集和測(cè)試樣本集中每個(gè)樣本均包括一張圖像及對(duì)應(yīng)的類別標(biāo)簽;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭州金惠計(jì)算機(jī)系統(tǒng)工程有限公司,未經(jīng)鄭州金惠計(jì)算機(jī)系統(tǒng)工程有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510901348.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 哈希數(shù)據(jù)處理方法和裝置
- 基于分布熵的局部敏感哈希高維索引方法
- 一種IPv6無狀態(tài)地址的處理方法和系統(tǒng)
- 網(wǎng)絡(luò)交換機(jī)設(shè)備中的準(zhǔn)確匹配哈希查找數(shù)據(jù)庫的方法及裝置
- 數(shù)據(jù)檢索裝置、數(shù)據(jù)存儲(chǔ)方法和數(shù)據(jù)檢索方法
- 用于傳輸數(shù)據(jù)的方法、裝置和系統(tǒng)
- 確定消息的數(shù)據(jù)摘要、基于多方的數(shù)字簽名的方法及系統(tǒng)
- 深度哈希學(xué)習(xí)方法及裝置
- 一種接口方法表生成方法、函數(shù)指針查詢方法及裝置
- 一種動(dòng)態(tài)哈希方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種哈希表動(dòng)態(tài)適應(yīng)數(shù)據(jù)的方法及裝置
- 數(shù)據(jù)完整性的保護(hù)和驗(yàn)證方法、設(shè)備和系統(tǒng)
- 創(chuàng)建哈希表的方法和設(shè)備
- 一種減少哈希沖突的哈希查找方法
- 一種哈希表處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)現(xiàn)哈希運(yùn)算的專用計(jì)算電路
- 哈希桶查找方法、哈希表存儲(chǔ)、哈希表查找方法和裝置
- 醫(yī)療數(shù)據(jù)系統(tǒng)的權(quán)限管理方法
- 數(shù)據(jù)壓縮器以及數(shù)據(jù)壓縮方法
- 一種動(dòng)態(tài)哈希方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





