[發明專利]一種圖片搜索的方法和裝置有效
| 申請號: | 201310148051.4 | 申請日: | 2013-04-25 |
| 公開(公告)號: | CN103226601B | 公開(公告)日: | 2019-03-29 |
| 發明(設計)人: | 黃際洲 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/58 | 分類號: | G06F16/58 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖片 搜索 方法 裝置 | ||
1.一種圖片搜索的方法,其特征在于,該方法包括:
線下挖掘階段,將搜索行為日志中的各query分別作為當前query以執行:
S11、從搜索行為日志中收集當前query以及當前query的相關query,構成當前query的搜索項集合;
S12、將當前query的搜索項集合中表達相同語義的query歸一化為一個興趣點,得到當前query的各興趣點;
S13、將當前query的各興趣點存儲于興趣點數據庫;
線上搜索階段:
S21、查詢所述興趣點數據庫,確定用戶當前輸入的query的興趣點;
S22、獲取所述用戶當前輸入的query的興趣點的圖片搜索結果,在用戶當前輸入的query的搜索結果頁中展現各興趣點以及各興趣點的圖片搜索結果。
2.根據權利要求1所述的方法,其特征在于,所述當前query的相關query包括:所述當前query的同義query、包含所述當前query的query以及包含所述當前query的同義query的query。
3.根據權利要求1或2所述的方法,其特征在于,所述從搜索行為日志中收集當前query以及當前query的相關query為:
從搜索行為日志中包含所述當前query的會話Session中收集所述當前query以及當前query的相關query。
4.根據權利要求1所述的方法,其特征在于,在所述步驟S12中還包括:依據興趣點所來源query的搜索次數確定各興趣點的搜索熱度;
在所述步驟S13中進一步將各興趣點的搜索熱度存儲于興趣點數據庫;
在所述步驟S22中,在所述搜索結果頁中依據各興趣點的搜索熱度對各興趣點進行排序。
5.根據權利要求1或4所述的方法,其特征在于,在所述步驟S12中還包括:確定所述當前query的各興趣點所屬的分類;
在所述步驟S13中進一步將各興趣點所屬的分類存儲于興趣點數據庫;
在所述步驟S22中,在所述搜索結果頁中進一步展現各興趣點所屬的分類。
6.根據權利要求5所述的方法,其特征在于,在所述搜索結果頁中,依據用戶的歷史搜索行為和各分類的搜索熱度中的至少一種對各分類進行排序;
各分類的搜索熱度由分類中各興趣點所來源的query的搜索次數確定。
7.根據權利要求1所述的方法,其特征在于,在所述步驟S21中確定用戶當前輸入的query的興趣點包括:
查詢所述興趣點數據庫中是否存在與用戶當前輸入的query表達相同語義的query,如果是,確定所述興趣點數據庫中與用戶當前輸入的query表達相同語義的query的興趣點。
8.根據權利要求1或7所述的方法,其特征在于,確定兩個query是否表達相同語義的方式具體為:
將兩個query進行分詞和去除停用詞的處理;
將處理后的兩個query進行比對,如果一個query比另一個query多出的部分為語義冗余短語,則認為這兩個query表達相同語義,或者如果兩個query中不同部分是同義詞,則認為這兩個query表達相同語義。
9.根據權利要求7所述的方法,其特征在于,如果所述興趣點數據庫中不存在與用戶當前輸入的query表達相同語義的query,則查詢所述興趣點數據庫中是否存在與用戶當前輸入的query表達相同語義的興趣點,如果是,轉至執行步驟S23;
S23、獲取所述與用戶當前輸入的query表達相同語義的興趣點的圖片搜索結果并展現于所述用戶當前輸入的query的搜索結果頁中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310148051.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型復式連接的USB連接線
- 下一篇:一種具有彈性性能的壓力傳感器





