[發明專利]一種相關搜索方法和裝置有效
| 申請號: | 201510092270.4 | 申請日: | 2015-02-28 |
| 公開(公告)號: | CN104715022B | 公開(公告)日: | 2018-07-31 |
| 發明(設計)人: | 胡軍;陳英傑;李偉 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 劉祥景 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相關 搜索 方法 裝置 | ||
本發明實施例提供了一種相關搜索方法和裝置,其中的方法具體包括:依據用戶輸入的搜索詞查詢索引表,以得到與所述搜索詞對應的相關列表;其中,所述索引表中存儲有搜索詞與相關列表之間的映射關系,所述相關列表中記錄有基于多種相關搜索詞挖掘方法得到的相關搜索詞與對應的分質量參數、以及基于日志統計得到的所述相關搜索詞的相關特征之間的映射關系;依據所述相關列表中記錄的相關搜索詞及所述相關搜索詞對應的分質量參數和相關特征,確定所述相關搜索詞的總質量參數;對總質量參數最高的若干個相關搜索詞進行展現。本發明實施例能夠有效提高相關搜索結果的多樣性以及覆蓋率。
技術領域
本發明涉及搜索引擎技術領域,特別是涉及一種相關搜索方法和裝置。
背景技術
隨著互聯網發展,信息的快速膨脹,人們對搜索引擎的依賴越來越大。但是在有些情況下,用戶輸入的搜索詞不能準確地描述搜索意圖,從而導致得到的搜索結果無法滿足用戶需求。為了提高用戶搜索的體驗度,相關搜索技術應運而生,相關搜索技術可以檢索所述搜索詞對應的相關搜索詞,并提供給用戶,以便于用戶的二次檢索。
傳統的相關搜索方法具有相關搜索詞多樣性較差的缺點,或者具有對于長尾搜索詞的搜索效果不佳的缺點,或者導致相關搜索覆蓋率較低。
發明內容
本發明實施例所要解決的技術問題是提供一種相關搜索方法和裝置,能夠有效提高相關搜索結果的多樣性以及覆蓋率。
為了解決上述問題,本發明公開了一種相關搜索方法,包括:
依據用戶輸入的搜索詞查詢索引表,以得到與所述搜索詞對應的相關列表;其中,所述索引表中存儲有搜索詞與相關列表之間的映射關系,所述相關列表中記錄有基于多種相關搜索詞挖掘方法得到的相關搜索詞與對應的分質量參數、以及基于日志統計得到的所述相關搜索詞的相關特征之間的映射關系;
依據所述相關列表中記錄的相關搜索詞及所述相關搜索詞對應的分質量參數和相關特征,確定所述相關搜索詞的總質量參數;
對總質量參數最高的若干個相關搜索詞進行展現。
優選地,通過如下步驟生成所述相關列表:
采用多種相關搜索詞挖掘方法挖掘得到搜索詞對應的相關搜索詞及所述相關搜索詞在各種相關搜索詞挖掘方法中對應的分質量參數;
對基于多種相關搜索詞挖掘方法得到的相關搜索詞及所述相關搜索詞在各種相關搜索詞挖掘方法中對應的分質量參數進行第一融合處理,得到所述相關搜索詞及所述相關搜索詞在多種相關搜索詞挖掘方法中對應的分質量參數;
通過分析日志得到所述相關搜索詞對應的相關特征;
對所述相關搜索詞及所述相關搜索詞在多種相關搜索詞挖掘方法中對應的分質量參數、及所述相關搜索詞對應的相關特征進行第二融合處理,得到所述相關搜索詞與分質量參數和相關特征之間的映射關系,并將所述映射關系記錄至相關列表。
優選地,所述相關搜索詞的相關特征包括所述相關搜索詞的點擊率,所述相關搜索詞對應的分質量參數包括:所述相關搜索詞在多種相關搜索詞挖掘方法中對應的分質量參數,則所述依據所述相關列表中記錄的相關搜索詞及所述相關搜索詞對應的分質量參數和相關特征,確定所述相關搜索詞的總質量參數的步驟,包括:
依據所述相關搜索詞的點擊率與點擊權重的乘積確定點擊參數;
對所述相關搜索詞在多種相關搜索詞挖掘方法中對應的分質量參數進行第一加權處理,得到相應的挖掘方法參數;
對所述點擊參數和所述挖掘方法參數進行第二加權處理,得到所述相關搜索詞的總質量參數。
優選地,所述相關搜索詞的點擊率為基于日志統計得到相關搜索詞的被點擊次數與被展現次數的比值。
優選地,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510092270.4/2.html,轉載請聲明來源鉆瓜專利網。





