[發明專利]一種獲取具有對比效果的圖片搜索結果的方法及裝置有效
| 申請號: | 201310319339.3 | 申請日: | 2013-07-26 |
| 公開(公告)號: | CN103455550A | 公開(公告)日: | 2013-12-18 |
| 發明(設計)人: | 黃際洲 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 獲取 具有 對比 效果 圖片 搜索 結果 方法 裝置 | ||
【技術領域】
本發明涉及圖片搜索技術,特別涉及一種獲取具有對比效果的圖片搜索結果的方法和裝置。
【背景技術】
目前的圖片搜索引擎根據用戶輸入的關鍵詞,查找圖片周圍文本中包含該關鍵詞的圖片作為搜索結果返回給用戶,如果用戶輸入的關鍵詞反映多個搜索需求,現有的圖片搜索引擎將對此無法判斷,其返回的結果很可能只反映其中的一個搜索需求,如果該搜索需求正好不符合用戶的意圖,則用戶可能需要經過多次搜索,才能獲得自己滿意的圖片。
請參考圖1,圖1是現有的圖片搜索引擎用戶搜索“東方不敗”時的返回結果。假設用戶在搜索“東方不敗”時,由演員“陳喬恩”扮演的“東方不敗”正處于電視臺的熱播階段,則用戶得到的圖片搜索結果就很可能如圖1所示,即用戶在搜索結果中很可能只能得到“陳喬恩”扮演的“東方不敗”這一種搜索需求的結果。但事實上用戶搜索“東方不敗”有可能想要演員“林青霞”扮演的結果,又或者用戶搜索“東方不敗”時,并不是想得到特定演員扮演的結果,而是希望分別得到不同演員扮演的結果。
【發明內容】
本發明所要解決的技術問題是提供一種獲取具有對比效果的圖片搜索結果的方法及裝置,以解決現有的圖片搜索引擎不能根據用戶的搜索需求返回全面的搜索結果的問題。
本發明為解決技術問題而采用的技術方案是提供一種獲取具有對比效果的圖片搜索結果的方法,包括:利用預設的種子詞從搜索日志中挖掘關鍵詞模板,其中所述種子詞包括種子中心詞及種子限定詞,所述種子中心詞在相同類目下反映一個以上的搜索需求,所述種子限定詞決定所述相同類目的范圍;利用所述關鍵詞模板從搜索日志中確定具有一個以上搜索需求的歧義詞;確定所述歧義詞相關聯的需求詞,其中一個相關聯的需求詞對應歧義詞的一個搜索需求;當用戶輸入的關鍵詞與所述歧義詞匹配時,將匹配詞相關聯的各個需求詞分別與匹配詞組合為搜索詞進行圖片搜索,以獲取匹配詞相關聯的各類圖片搜索結果,并將各類圖片搜索結果對比展示,其中一類圖片搜索結果對應一個搜索需求。
根據本發明之一優選實施例,所述步驟A包括:從搜索日志中提取包含種子中心詞及種子限定詞的歷史搜索詞;將提取的歷史搜索詞中包含的種子中心詞泛化為模板槽,以得到關鍵詞模板。
根據本發明之一優選實施例,所述步驟B包括:針對搜索日志的歷史搜索詞中與模板槽匹配的中心詞,根據該中心詞匹配到的各個關鍵詞模板的置信度之和確定該中心詞的歧義分值,其中一個關鍵詞模板的置信度等于該關鍵詞模板的模板槽匹配的相異種子中心詞個數與預設的種子中心詞總數之比;將歧義分值超過預設第一閾值的中心詞確定為具有一個以上搜索需求的歧義詞。
根據本發明之一優選實施例,所述步驟C包括:以會話為單位對搜索日志進行切分;當切分得到的同一個會話中存在一個搜索動作包含歧義詞,且另一搜索動作不僅包含該歧義詞,還包括設定類別詞時,將所述設定類別詞作為該歧義詞相關聯的候選需求詞;計算歧義詞的候選需求詞的需求熱度,并將需求熱度高于預設第二閾值的候選需求詞作為最終的需求詞。
根據本發明之一優選實施例,所述步驟D在對各類圖片搜索結果對比展示時,根據匹配詞相關聯的需求詞的需求熱度,確定各類圖片搜索結果的排列順序。
本發明還提供了一種獲取具有對比效果的圖片搜索結果的裝置,包括:模板挖掘單元,用于利用預設的種子詞從搜索日志中挖掘關鍵詞模板,其中所述種子詞包括種子中心詞及種子限定詞,所述種子中心詞在相同類目下反映一個以上的搜索需求,所述種子限定詞決定所述相同類目的范圍;歧義詞挖掘單元,用于利用所述關鍵詞模板從搜索日志中確定具有一個以上搜索需求的歧義詞;需求詞挖掘單元,用于確定所述歧義詞相關聯的需求詞,其中一個相關聯的需求詞對應歧義詞的一個搜索需求;展示單元,用于當用戶輸入的關鍵詞與所述歧義詞匹配時,將匹配詞相關聯的各個需求詞分別與匹配詞組合為搜索詞進行圖片搜索,以獲取匹配詞相關聯的各類圖片搜索結果,并將各類圖片搜索結果對比展示,其中一類圖片搜索結果對應一個搜索需求。
根據本發明之一優選實施例,所述模板挖掘單元包括:提取子單元,用于從搜索日志中提取包含種子中心詞及種子限定詞的歷史搜索詞;泛化子單元,用于將提取的歷史搜索詞中包含的種子中心詞泛化為模板槽,以得到關鍵詞模板。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310319339.3/2.html,轉載請聲明來源鉆瓜專利網。





