[發(fā)明專利]圖片搜索方法和圖片搜索系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201110100485.8 | 申請(qǐng)日: | 2011-04-21 |
| 公開(公告)號(hào): | CN102147815A | 公開(公告)日: | 2011-08-10 |
| 發(fā)明(設(shè)計(jì))人: | 段凌宇;紀(jì)榮嶸;陳杰;李冰;黃鐵軍;姚鴻勛;高文 | 申請(qǐng)(專利權(quán))人: | 北京大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 馬晶晶 |
| 地址: | 100871*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖片 搜索 方法 系統(tǒng) | ||
1.一種圖片搜索方法,其特征在于,包括:
客戶端接收查詢內(nèi)容,該查詢內(nèi)容包括待查詢的目標(biāo)圖片、或者待查詢的目標(biāo)圖片和相關(guān)信息;
客戶端獲取目標(biāo)圖片的視覺單詞,并依據(jù)預(yù)置規(guī)則在客戶端的一個(gè)以上的視覺單詞詞典中選取與查詢內(nèi)容對(duì)應(yīng)的至少一個(gè)目標(biāo)視覺單詞詞典,以及,依據(jù)目標(biāo)視覺單詞詞典獲取視覺單詞的目標(biāo)視覺單詞;
將目標(biāo)視覺單詞編碼后發(fā)送至服務(wù)端,以獲取匹配查詢內(nèi)容的結(jié)果圖片和/或結(jié)果圖片的相關(guān)信息。
2.根據(jù)權(quán)利要求1所述的圖片搜索方法,其特征在于:
依據(jù)預(yù)置規(guī)則在客戶端的一個(gè)以上的視覺單詞詞典中選取與查詢內(nèi)容對(duì)應(yīng)的至少一個(gè)目標(biāo)視覺單詞詞典,的步驟包括:
依據(jù)查詢內(nèi)容的類型,從客戶端預(yù)先預(yù)置的一個(gè)或多個(gè)視覺單詞詞典庫(kù)中,查找匹配查詢內(nèi)容的類型的視覺單詞詞典庫(kù)及預(yù)測(cè)損失函數(shù);以及
采用預(yù)測(cè)損失函數(shù)計(jì)算視覺單詞詞典庫(kù)中的各視覺單詞詞典對(duì)目標(biāo)圖片的視覺單詞的預(yù)測(cè)損失值,獲取閾值范圍內(nèi)的一個(gè)或多個(gè)視覺單詞詞典。
3.根據(jù)權(quán)利要求2所述的圖片搜索方法,其特征在于,所述查詢內(nèi)容的類型包括:
目標(biāo)圖片類、目標(biāo)圖片和文本類、目標(biāo)圖片和傳感器檢測(cè)的信號(hào)類,目標(biāo)圖片和物體識(shí)別軟件識(shí)別出圖片中物體標(biāo)簽;
其中,傳感器檢測(cè)的信號(hào)包括利用全球定位系統(tǒng)裝置檢測(cè)到地理位置信息,用條碼掃描器掃描到圖書或商品的條碼條形碼,用電子標(biāo)簽閱讀器讀取電子標(biāo)簽;
物體識(shí)別軟件識(shí)別的物體標(biāo)簽包括用人臉識(shí)別軟件識(shí)別出人臉,文字識(shí)別系統(tǒng)軟件識(shí)別出文字。
4.根據(jù)權(quán)利要求2所述的圖片搜索方法,其特征在于:
客戶端預(yù)先預(yù)置的一個(gè)或多個(gè)視覺單詞詞典庫(kù)為客戶端預(yù)先從服務(wù)端獲取的,并且,所述客戶端定時(shí)更新所述一個(gè)或多個(gè)視覺單詞詞典庫(kù);
所述服務(wù)端建立一個(gè)或多個(gè)視覺單詞詞典庫(kù)的步驟包括:
采用圖片集合劃分方式將服務(wù)端數(shù)據(jù)庫(kù)中的圖片劃分為各類型的圖片集合,以及,建立各圖片集合對(duì)應(yīng)的視覺單詞詞典,分析各個(gè)圖片對(duì)應(yīng)的視覺單詞詞典,若視覺單詞詞典滿足視覺單詞詞典庫(kù)建立條件,則各類型的圖片集合對(duì)應(yīng)的視覺單詞詞典的集合組成一個(gè)視覺單詞詞典庫(kù);
其中:視覺單詞詞典庫(kù)建立條件為:
劃分后各個(gè)圖片集合的視覺單詞詞典中視覺單詞數(shù)目小于等于服務(wù)端數(shù)據(jù)庫(kù)的視覺單詞詞典的視覺單詞總數(shù);
并且統(tǒng)計(jì)該圖片集合的視覺單詞的概率分布,并計(jì)算視覺單詞概率分布的熵,其概率分布的信息熵小于設(shè)定閾值。
5.根據(jù)權(quán)利要求4所述的圖片搜索方法,其特征在于:
視覺單詞詞典為:將圖片集合的視覺特征采用聚類方式建立圖片的原始視覺單詞詞典;或者,
對(duì)圖片集合的視覺特征采用聚類方式建立圖片的視覺單詞詞典,基于有效視覺單詞詞典的篩選規(guī)則,確定代表原始視覺單詞詞典的有效視覺單詞詞典,將有效視覺單詞詞典作為視覺單詞詞典。
6.根據(jù)權(quán)利要求4所述的圖片搜索方法,其特征在于:
采用圖片集合劃分方式將服務(wù)端數(shù)據(jù)庫(kù)中的圖片劃分為各類型的圖片集合的步驟包括:
利用圖片之間視覺相似性將所有圖片劃分成多個(gè)圖片集合;或者,
利用與圖片有關(guān)信息如圖片的拍照日期、文本標(biāo)簽、電子標(biāo)簽等將所有圖片劃分成多個(gè)圖片集合;或者
利用圖片之間視覺相似性和與圖片有關(guān)信息拍照日期、文本標(biāo)簽、電子標(biāo)簽等將所有圖片劃分成多個(gè)集合。
7.根據(jù)權(quán)利要求2所述的圖片搜索方法,其特征在于:
采用預(yù)測(cè)損失函數(shù)計(jì)算視覺單詞詞典庫(kù)中的各視覺單詞詞典對(duì)目標(biāo)圖片的視覺單詞的預(yù)測(cè)損失值的步驟中,預(yù)測(cè)損失值的計(jì)算方式如下:
目標(biāo)圖片的視覺單詞和目標(biāo)視覺單詞詞典所在圖片類的類中心的余弦距離;或
目標(biāo)圖片的視覺單詞和目標(biāo)視覺單詞詞典所在圖片類的類中心的余弦距離,以及相關(guān)信息和視覺單詞詞典所在圖片類的同類信息的歐式距離的加權(quán)和;或
目標(biāo)圖片和目標(biāo)視覺單詞詞典的視覺單詞詞典所在圖片類的視覺相似性距離,以及相關(guān)信息和視覺單詞詞典所在圖片類的同類信息的歐式距離的乘積。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué),未經(jīng)北京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110100485.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





