[發(fā)明專利]一種圖片推薦方法和裝置有效
| 申請?zhí)枺?/td> | 201210009043.7 | 申請日: | 2012-01-12 |
| 公開(公告)號: | CN102609458A | 公開(公告)日: | 2012-07-25 |
| 發(fā)明(設(shè)計(jì))人: | 路晶 | 申請(專利權(quán))人: | 北京搜狗信息服務(wù)有限公司;北京搜狗科技發(fā)展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識(shí)產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 圖片 推薦 方法 裝置 | ||
技術(shù)領(lǐng)域
本申請涉及圖片處理技術(shù)領(lǐng)域,特別是涉及一種圖片推薦方法和裝置。
背景技術(shù)
目前隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,用戶對搜索引擎的要求已經(jīng)不再滿足于只是對文本的搜索,很多用戶還希望可以通過搜索引擎對網(wǎng)絡(luò)圖片進(jìn)行搜索。
目前的圖片搜索引擎大都采用基于文本的搜索技術(shù),該技術(shù)將圖片作為數(shù)據(jù)庫存儲(chǔ)的對象,用關(guān)鍵字對其進(jìn)行描述。然而對于圖片中包含的視覺特征,如顏色或形狀等,無法用文本進(jìn)行描述,這樣,當(dāng)需要根據(jù)圖片中包含的視覺特征搜索圖片時(shí),基于文本的搜索技術(shù)將不再適用。例如,用戶經(jīng)常遇到這樣的問題,在網(wǎng)站或電腦上看到一張包含物品的圖片,但并不知道該圖片中的物品是什么,故很難將該物品的視覺特征用語言描述出來,即便表達(dá)能力好的用戶將其視覺特征描述出來了,也很難在現(xiàn)有的搜索引擎中找到與該圖片相似的圖片,導(dǎo)致搜索效率低下,使用網(wǎng)絡(luò)流量較大。
針對上述搜索效率低下、使用網(wǎng)絡(luò)流量較大的問題,一些圖片搜索引擎提供以圖搜圖功能,該以圖搜圖功能將視覺內(nèi)容一致的圖片返回給用戶,以滿足用戶的某些搜索需求。例如某些用戶愛好搜集圖片,最不能容忍的就是美圖上面有水印,只要上傳圖片到圖片搜索引擎,輕輕一點(diǎn)便能搜出不帶水印的圖片;又如,可以上傳小圖片,搜到這個(gè)小圖片的各個(gè)版本,如清晰大圖等。
還有一些圖片搜索引擎在提供以圖搜圖功能的同時(shí)提供圖片推薦功能,參照圖1,示出了現(xiàn)有技術(shù)一種圖片搜索引擎中圖片推薦方法的流程圖,具體可以包括:
步驟101、用戶提交查詢圖片;
步驟102、抽取查詢圖片的顏色、紋理、形狀等視覺特征;
步驟103、將查詢圖片的視覺特征與數(shù)據(jù)庫中圖片的視覺特征進(jìn)行相似性比對;
步驟104、將視覺相似圖片推薦給用戶。
由于圖片推薦結(jié)果依據(jù)的顏色、紋理、形狀等視覺特征比對得到,故這里的視覺相似主要指外觀相似,例如用戶上傳妮可基德曼的圖片,圖片中妮可基德曼的頭發(fā)顏色為金色,則圖片搜索引擎可能會(huì)返回視覺相似的含有金色頭發(fā)的圖片,如金發(fā)女郎的圖片,有時(shí)甚至?xí)祷亟鹈膱D片,等等。
但有些用戶存在一些個(gè)性化需求,如用戶上傳劉德華的圖片,還可能希望看到劉德華的電影海報(bào)、個(gè)人寫真等圖片。此時(shí),現(xiàn)有技術(shù)中視覺內(nèi)容一致的搜索結(jié)果和視覺相似的圖片推薦結(jié)果均不能滿足用戶的個(gè)性化需求。
總之,需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是:如何能夠提供契合用戶個(gè)性化需求的圖片。
發(fā)明內(nèi)容
本申請所要解決的技術(shù)問題是提供一種圖片推薦方法和裝置,能夠提供契合用戶個(gè)性化需求的圖片,擴(kuò)展用戶感興趣信息的獲取渠道。
為了解決上述問題,本申請公開了一種圖片推薦方法,包括:
接收用戶的查詢請求,并搜索得到與該查詢請求對應(yīng)的目標(biāo)圖片和與該目標(biāo)圖片相同或近似的結(jié)果圖片;
依據(jù)所述結(jié)果圖片所在的網(wǎng)頁文本,抽取描述圖片語義特征的關(guān)鍵詞,作為該目標(biāo)圖片的關(guān)鍵詞;
在搜索日志中進(jìn)行關(guān)鍵詞的匹配,并將與關(guān)鍵詞匹配的相應(yīng)目標(biāo)圖片推薦給用戶;所述搜索日志記錄有全網(wǎng)用戶的在線查詢請求對應(yīng)的目標(biāo)圖片及相應(yīng)的關(guān)鍵詞。
優(yōu)選的,所述依據(jù)所述結(jié)果圖片所在的網(wǎng)頁文本,抽取描述圖片語義特征的關(guān)鍵詞的步驟,包括:
依據(jù)對所述網(wǎng)頁文本進(jìn)行聚類分析的結(jié)果,去除所述網(wǎng)頁文本中孤立的網(wǎng)頁文本,得到剩余文本;
抽取所述剩余文本中詞頻最高并具有實(shí)際意義的詞或短語,作為描述圖片語義特征的關(guān)鍵詞。
優(yōu)選的,通過以下步驟抽取所述剩余文本中具有實(shí)際意義的詞或短語:
調(diào)用預(yù)先構(gòu)造的實(shí)體詞庫,在所述剩余文本中的詞或短語與所述實(shí)體詞庫中的實(shí)體詞相匹配時(shí),保留所述詞或短語;所述實(shí)體詞庫存儲(chǔ)有具有實(shí)際意義的實(shí)體詞。
優(yōu)選的,通過以下步驟抽取所述剩余文本中具有實(shí)際意義的詞或短語:
依據(jù)詞性抽取所述剩余文本中具有實(shí)際意義的詞或短語,所述抽取過程包括:
在所述剩余文本中的詞或短語為嘆詞、代詞或語氣助詞中的任一種時(shí),丟棄所述詞或短語。
優(yōu)選的,所述依據(jù)所述結(jié)果圖片所在的網(wǎng)頁文本,抽取描述圖片語義特征的關(guān)鍵詞的步驟,還包括:
依據(jù)所述關(guān)鍵詞與所述剩余文本中其他詞匯的相鄰共現(xiàn)頻率,統(tǒng)計(jì)所述剩余文本中與所述關(guān)鍵詞相鄰的邊緣詞;將所述邊緣詞與關(guān)鍵詞一起作為描述圖片語義特征的關(guān)鍵詞。
優(yōu)選的,所述方法還包括:
在與關(guān)鍵詞匹配的相應(yīng)各目標(biāo)圖片中濾除相同或近似的圖片,得到剩余圖片;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京搜狗信息服務(wù)有限公司;北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗信息服務(wù)有限公司;北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210009043.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:多孔球狀反應(yīng)裝置及操作方法
- 下一篇:多軸攪拌樁鉆機(jī)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





