[發明專利]一種搜索引擎排序的方法、系統以及一種搜索引擎有效
| 申請號: | 201310064582.5 | 申請日: | 2013-02-28 |
| 公開(公告)號: | CN104021125B | 公開(公告)日: | 2018-04-06 |
| 發明(設計)人: | 盧中縣;韓小梅;馮景華 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 趙娟 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搜索引擎 排序 方法 系統 以及 | ||
技術領域
本申請涉及數據搜索的技術領域,特別是涉及一種搜索引擎排序的方法,以及,一種搜索引擎排序的系統,以及,一種搜索引擎。
背景技術
目前的大型搜索引擎為了提升搜索效率,往往是采用分布式檢索的方案,即有多個搜索服務器(searcher)負責實際的檢索工作,同時還有一臺總控服務器(merger)負責查詢串解析,任務分發和最終的結果合并。而目前大多數搜索引擎在merger端的結果合并操作都非常簡單,都是按照各個searcher返回結果的得分,做簡單排序后,取排序在前的N個結果進行展示,這種方式主要存在以下兩方面的不足:
一方面,大多數搜索引擎采用qurey(搜索關鍵詞)擴展的方式,結合不同類別的索引庫,對多種檢索結果進行聚合(如淘寶搜索會將淘寶商城的搜索和淘寶集市的搜索進行聚合;百度搜索會將文本,視頻,問答等形式搜索的多種結果進行聚合)。這種方式的主要思想是建立多個不同的專題索引庫,將所述多個專題索引庫的檢索結果進行聚合。因此所述聚合的粒度只能是專題級別的,而針對某一個特定的專題索引庫,在排序上可能有N個影響排序的特征因子,這種方式很難精確控制具備某一種或某幾種特征的專題搜索結果在合并后的搜索結果中的數量,位置或比例,從而無法做到對這個特定的專題索引庫的某一個或多個特征因子進行全局調控。
另一方面,在searcher端通過調整各特征的擬合權重,來控制總體的結果比例。由于大部分大型搜索引擎都是分布式搜索,存在多個searcher(假設為N),每個searcher只保存1/N的索引內容,因而不管在searcher上怎么調整,也只能做到排序局部上的把控,無法從整體上進行調控。
因此,本領域技術人員迫切需要解決的問題是:提供一種搜索引擎排序的機制,用以實現搜索結果全局排序最優化,以及精確控制某一種或幾種特征的數量、位置和比例。
發明內容
本申請所要解決的技術問題是提供一種搜索引擎排序的方法,用以實現搜索結果全局排序最優化,以及精確控制某一種或幾種特征的數量、位置和比例。
相應的,本申請還提供了一種搜索引擎排序的系統,以及一種搜索引擎,用以保證上述方法在實際中的應用。
為了解決上述問題,本申請公開了一種搜索引擎排序的方法,包括:
獲取候選搜索結果集,所述候選搜索結果集包括一個或多個搜索結果;
將所述一個或多個搜索結果劃分到多個子集中;
分別從所述子集中抽取搜索結果生成展示頁。
優選地,所述候選搜索結果集中還包括所述一個或多個搜索結果對應的聚合特征,所述獲取候選搜索結果集的步驟包括:
接收搜索請求;
將所述搜索請求分發至一個或多個搜索服務器中;
接收所述搜索服務器返回的預設格式的搜索結果以及對應的聚合特征,所述聚合特征為所述搜索服務器對接收到的搜索請求進行搜索,得到一個或多個搜索結果后,依據所述一個或多個搜索結果計算得到的指定的聚合特征;
對所述預設格式的搜索結果以及對應的聚合特征進行解析,得到處理后的搜索結果及對應的聚合特征。
優選地,所述候選搜索結果集由按照預設格式組織前N個搜索結果以及對應的聚合特征生成,其中N為正整數。
優選地,所述方法還包括:
在對所述預設格式的搜索結果以及對應的聚合特征進行解析后,對所述預設格式的搜索結果以及對應的聚合特征進行歸一化處理。
優選地,所述將一個或多個搜索結果劃分到多個子集中的步驟包括:
提取所述一個或多個搜索結果的聚合特征;
針對所述聚合特征按照預設屬性進行分類,生成具有對應分類屬性的子集;
將所述一個或多個搜索結果劃分到對應分類屬性的子集中。
優選地,所述聚合特征包括點擊率和/或轉化率,所述針對聚合特征按照預設屬性進行分類,生成具有對應分類屬性的子集的子步驟包括:
按不同聚合特征的范圍值分類,生成對應不同范圍值的子集;
所述將的一個或多個搜索結果劃分到對應分類屬性的子集中的子步驟包括:
將所述點擊率和/或轉化率在對應閾值范圍內的搜索結果分別劃分至對應子集中。
優選地,所述分別從子集中抽取搜索結果生成展示頁的步驟包括:
分別對所述子集內的搜索結果進行排序;
獲取每個展示頁的預設抽取策略,所述預設抽取策略包括每個子集抽取的順序以及抽取比例;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310064582.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鉛酸蓄電池正極鉛膏
- 下一篇:倒裝芯片型半導體裝置的制造方法





