[發(fā)明專利]圖像檢索方法和裝置、計算機設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201710433984.6 | 申請日: | 2017-06-09 |
| 公開(公告)號: | CN109033107B | 公開(公告)日: | 2021-09-17 |
| 發(fā)明(設(shè)計)人: | 賴韓江 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司;中山大學(xué) |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 檢索 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
本發(fā)明提供一種圖像檢索方法和裝置、計算機設(shè)備和存儲介質(zhì),包括:獲取檢索圖像;將檢索圖像輸入預(yù)先對具有相似關(guān)系的訓(xùn)練圖像樣本訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò),通過輸入層和前置卷積層得到第一輸出結(jié)果;第一輸出結(jié)果輸入到的分支網(wǎng)絡(luò),得到每個像素點為物體的概率對應(yīng)的物體的位置概率圖;第一輸出結(jié)果輸入到卷積神經(jīng)網(wǎng)絡(luò)的中間卷積層,得到檢索圖像的特征圖;對特征圖與位置概率圖進(jìn)行點乘處理得到融合位置信息的特征圖,并將融合位置信息的特征圖輸入至卷積神經(jīng)網(wǎng)絡(luò)的后置卷積層,通過后置卷積層和全連接層,輸出檢索圖像的特征向量;將檢索圖像的特征向量與數(shù)據(jù)庫的各圖像的特征向量進(jìn)行比較,得到檢索圖像的檢索結(jié)果。該方法精確度高。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機設(shè)備技術(shù)領(lǐng)域,特別是涉及一種圖像檢索方法和裝置、計算機設(shè)備和存儲介質(zhì)。
背景技術(shù)
圖像檢索,是通過輸入圖片來檢索相似的圖片的一種技術(shù),為用戶提供相關(guān)圖形圖像資料檢索的搜索技術(shù)。
用戶在進(jìn)行圖像檢索時,輸入的圖像的主體通常為檢索目標(biāo),但往往輸入的圖像除主體外,還包括背景信息。為了得到精確的檢索結(jié)果,在進(jìn)行圖像檢索時往往需要去除背景信息,以消除背景信息對圖像檢索的影響。在利用神經(jīng)網(wǎng)絡(luò)自適應(yīng)學(xué)習(xí)的圖像檢索模型中,為解決這個問題,需要在訓(xùn)練時標(biāo)注主體的位置信息,并基于此訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
這種方式需要人工預(yù)先對訓(xùn)練圖像樣本進(jìn)行大量的標(biāo)注,單純依賴人工標(biāo)注不僅需要消耗大量的人力資源,還可能產(chǎn)生個體性的標(biāo)注錯誤,從而影響圖像檢索的精確度。
發(fā)明內(nèi)容
基于此,有必要針對因人工標(biāo)注導(dǎo)致的圖像檢索的精確度受到影響的問題,提供一種圖像檢索方法和裝置、計算機設(shè)備和存儲介質(zhì)。
為達(dá)到上述目的,一個實施例采用以下技術(shù)方案:
一種圖像檢索方法,包括:
獲取檢索圖像;
將所述檢索圖像輸入預(yù)先對具有相似關(guān)系的訓(xùn)練圖像樣本訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò),通過所述卷積神經(jīng)網(wǎng)絡(luò)的輸入層和前置卷積層得到第一輸出結(jié)果;
所述第一輸出結(jié)果輸入到所述卷積神經(jīng)網(wǎng)絡(luò)的分支網(wǎng)絡(luò),得到每個像素點為物體的概率對應(yīng)的物體的位置概率圖;
所述第一輸出結(jié)果輸入到所述卷積神經(jīng)網(wǎng)絡(luò)的中間卷積層,得到所述檢索圖像的特征圖;
對所述特征圖與所述位置概率圖進(jìn)行點乘處理得到融合位置信息的特征圖,并將所述融合位置信息的特征圖輸入至所述卷積神經(jīng)網(wǎng)絡(luò)的后置卷積層,通過后置卷積層和全連接層,輸出所述檢索圖像的特征向量;
將所述檢索圖像的特征向量與數(shù)據(jù)庫的各圖像的特征向量進(jìn)行比較,得到所述檢索圖像的檢索結(jié)果。
一種圖像檢索方裝置,包括:圖像獲取模塊、卷積神經(jīng)網(wǎng)絡(luò)模塊、檢索模塊;
所述圖像獲取模塊,用于獲取檢索圖像;
所述卷積神經(jīng)網(wǎng)絡(luò)模塊,用于將所述檢索圖像輸入預(yù)先對具有相似關(guān)系的訓(xùn)練圖像樣本訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò),通過所述卷積神經(jīng)網(wǎng)絡(luò)的輸入層和前置卷積層得到第一輸出結(jié)果;所述第一輸出結(jié)果輸入到所述卷積神經(jīng)網(wǎng)絡(luò)的分支網(wǎng)絡(luò),得到每個像素點為物體的概率對應(yīng)的物體的位置概率圖;所述第一輸出結(jié)果輸入到所述卷積神經(jīng)網(wǎng)絡(luò)的中間卷積層,得到所述檢索圖像的特征圖;對所述特征圖與所述位置概率圖進(jìn)行點乘處理得到融合位置信息的特征圖,并將所述融合位置信息的特征圖輸入至所述卷積神經(jīng)網(wǎng)絡(luò)的后置卷積層,通過后置卷積層和全連接層,輸出所述檢索圖像的特征向量;
所述檢索模塊,用于將所述檢索圖像的特征向量與數(shù)據(jù)庫的各圖像的特征向量進(jìn)行比較,得到所述檢索圖像的檢索結(jié)果。
一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)上述的圖像檢索方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司;中山大學(xué),未經(jīng)騰訊科技(深圳)有限公司;中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710433984.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





