[發(fā)明專(zhuān)利]一種圖像檢索方法及終端在審
| 申請(qǐng)?zhí)枺?/td> | 201611169213.2 | 申請(qǐng)日: | 2016-12-16 |
| 公開(kāi)(公告)號(hào): | CN106649688A | 公開(kāi)(公告)日: | 2017-05-10 |
| 發(fā)明(設(shè)計(jì))人: | 吳偉華;康春生;蔡復(fù)興 | 申請(qǐng)(專(zhuān)利權(quán))人: | 深圳市華尊科技股份有限公司 |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30 |
| 代理公司: | 廣州三環(huán)專(zhuān)利代理有限公司44202 | 代理人: | 郝傳鑫,熊永強(qiáng) |
| 地址: | 518000 廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖像 檢索 方法 終端 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及視頻監(jiān)控技術(shù)領(lǐng)域,具體涉及一種圖像檢索方法及終端。
背景技術(shù)
目前來(lái)看,以圖搜圖是通過(guò)搜索圖像文本或者視覺(jué)特征,為用戶(hù)提供互聯(lián)網(wǎng)上相關(guān)圖形圖像資料檢索服務(wù)的專(zhuān)業(yè)搜索引擎系統(tǒng),是搜索引擎的一種細(xì)分。涉及了數(shù)據(jù)庫(kù)管理、計(jì)算機(jī)視覺(jué)、圖像處理、模式識(shí)別、信息檢索和認(rèn)知心理學(xué)等諸多學(xué)科。商用的圖像搜索引擎有谷歌圖像搜索和百度圖像搜索。這些搜索系統(tǒng)都是基于關(guān)鍵字和圖像標(biāo)簽的。基于關(guān)鍵字的圖像視頻檢索有著其本質(zhì)的缺點(diǎn)。圖像中內(nèi)容豐富,僅用幾個(gè)關(guān)鍵字或數(shù)句話(huà)很難表達(dá)清楚,而且不同的人對(duì)圖像有不同的理解,導(dǎo)致同一幅圖像可能會(huì)有相差很大的說(shuō)明。并且,現(xiàn)在圖像的數(shù)量呈爆炸式的增加,很多圖像只有很少的文字信息或者根本就沒(méi)有說(shuō)明文字,想要高效地索引這些圖像就需要人們手工的添加標(biāo)簽和說(shuō)明文字,對(duì)于大量的圖像來(lái)說(shuō),這是非常繁重的工作。因此,通過(guò)樣本的搜索,到查詢(xún)圖像類(lèi)似的圖像搜索,已經(jīng)逐漸成為現(xiàn)代圖像搜索引擎中不可缺少的功能。一個(gè)有效的圖像相似性度量是在尋找類(lèi)似的圖像的核心。
現(xiàn)有技術(shù)中,對(duì)于以圖搜圖算法,常用的方法種類(lèi)比較多,比如基于顏色、紋理和形狀等。深度訓(xùn)練是一種目的在于建立、模擬人腦進(jìn)行分析訓(xùn)練的深度網(wǎng)絡(luò),它模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù)。通過(guò)組合低層特征形成更加抽象的高層表示屬性類(lèi)別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。它顯著的優(yōu)點(diǎn)是可抽象出高級(jí)特征,構(gòu)建出復(fù)雜高性能的模型。基于深度特征訓(xùn)練的以圖搜圖方法主要包括兩個(gè)步驟:一是特征提取,提取可靠穩(wěn)定的特征表達(dá)圖像內(nèi)容;二是特征相似度度量,將不同圖像特征進(jìn)行比較和相似度排序,但是,由于得到的相似性特征較為復(fù)雜,因而,圖像的檢索效率較低。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種圖像檢索方法及終端,以期降低相似性特征的復(fù)雜度,從而,提高圖像檢索效率。
本發(fā)明實(shí)施例第一方面提供了一種圖像檢索方法,包括:
獲取三元組樣本,其中,所述三元組樣本包括:待查詢(xún)圖像,正樣本圖像和負(fù)樣本圖像;
采用預(yù)設(shè)卷積網(wǎng)絡(luò)對(duì)所述三元組樣本進(jìn)行訓(xùn)練,得到圖像特征三元組,其中,所述預(yù)設(shè)卷積網(wǎng)絡(luò)至少包含四個(gè)卷積層和一個(gè)平均池化層;
將所述圖像特征三元組映射為目標(biāo)哈希編碼;
采用預(yù)設(shè)三元組排序損失模型對(duì)所述目標(biāo)哈希編碼進(jìn)行訓(xùn)練,得到目標(biāo)相似性特征。
可選地,所述將所述圖像特征三元組映射為目標(biāo)哈希編碼,包括:
將所述圖像特征三元組中處于所述預(yù)設(shè)卷積網(wǎng)絡(luò)的指定層特征分割成等長(zhǎng)的Q個(gè)片段,所述Q為大于1的整數(shù);
通過(guò)所述預(yù)設(shè)卷積網(wǎng)絡(luò)的全連接層分別將所述Q個(gè)片段映射成一維向量,得到所述Q個(gè)一維向量;
通過(guò)sigmoid激活函數(shù)將所述Q個(gè)一維向量的值限制在0到1之間,得到所述Q個(gè)目標(biāo)一維向量;
按照如下公式將所述Q個(gè)目標(biāo)一維向量的值轉(zhuǎn)換成二進(jìn)制的哈希編碼,得到所述Q個(gè)哈希編碼:
其中:ε為預(yù)設(shè)閾值,s為一維向量的任一位,H為哈希編碼;
將所述Q個(gè)哈希編碼進(jìn)行連接,得到所述目標(biāo)哈希編碼。
可選地,所述采用預(yù)設(shè)三元組排序損失模型對(duì)所述目標(biāo)哈希編碼進(jìn)行訓(xùn)練,得到目標(biāo)相似性特征,包括:
按照如下公式對(duì)所述目標(biāo)哈希編碼進(jìn)行訓(xùn)練,得到目標(biāo)相似性特征:
其中,Iq表示所述待查詢(xún)圖像,q表示卷積最大激活區(qū)域,I+表示所述正樣本圖像,I-表示所述負(fù)樣本圖像,m為常數(shù),l(Iq,I+,I-)為目標(biāo)相似性特征。
可選地,所述預(yù)設(shè)卷積網(wǎng)絡(luò)的每一卷積層插入了1×1的濾波卷積層,且所述每一卷積層包含矯正激活函數(shù)。
可選地,所述采用預(yù)設(shè)三元組排序損失模型對(duì)所述目標(biāo)哈希編碼進(jìn)行訓(xùn)練,得到目標(biāo)相似性特征之后,所述方法還包括:
根據(jù)所述目標(biāo)相似性特征,確定所述待查詢(xún)圖像與預(yù)設(shè)圖像庫(kù)中的N張圖像中的每一圖像之間的漢明距離,得到所述N個(gè)漢明距離值,所述N為正整數(shù);將所述N個(gè)漢明距離值中的最小值對(duì)應(yīng)的圖像作為目標(biāo)圖像。
本發(fā)明實(shí)施例第二方面提供了一種終端,包括:
獲取單元,用于獲取三元組樣本,其中,所述三元組樣本包括:待查詢(xún)圖像,正樣本圖像和負(fù)樣本圖像;
第一訓(xùn)練單元,用于采用預(yù)設(shè)卷積網(wǎng)絡(luò)對(duì)所述三元組樣本進(jìn)行訓(xùn)練,得到圖像特征三元組,其中,所述預(yù)設(shè)卷積網(wǎng)絡(luò)至少包含四個(gè)卷積層和一個(gè)平均池化層;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于深圳市華尊科技股份有限公司,未經(jīng)深圳市華尊科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611169213.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 用戶(hù)從用戶(hù)終端遠(yuǎn)程訪(fǎng)問(wèn)終端設(shè)備的遠(yuǎn)程訪(fǎng)問(wèn)系統(tǒng)和方法
- 功能信息通知系統(tǒng)及功能信息通知方法
- 一種用于殯儀館的計(jì)算機(jī)信息處理裝置
- 視頻通話(huà)切換方法和系統(tǒng)
- 一種終端能力上報(bào)方法、基站及終端
- 野外消防遠(yuǎn)程監(jiān)控系統(tǒng)及其監(jiān)控方法
- 終端主體、終端屏幕和終端
- 一種終端類(lèi)型的確定方法、網(wǎng)絡(luò)設(shè)備及終端
- 一種數(shù)據(jù)傳輸方法及裝置
- 一種基于網(wǎng)絡(luò)運(yùn)營(yíng)的一站式零售直播矩陣平臺(tái)





