[發明專利]搜索方法、裝置以及設備有效
| 申請號: | 201810751704.0 | 申請日: | 2018-07-10 |
| 公開(公告)號: | CN110765345B | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 詹宇森;笪慶;曾安祥 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9538 |
| 代理公司: | 北京展翼知識產權代理事務所(特殊普通合伙) 11452 | 代理人: | 屠長存 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 方法 裝置 以及 設備 | ||
本公開提出了一種搜索方法、裝置以及設備。基于用戶信息和搜索請求,從特征集中選取部分排序特征,其中,所述特征集中的排序特征為對搜索結果進行排序時所使用的特征;以及基于所述部分排序特征對響應于所述搜索請求執行搜索而得到的搜索結果進行排序,以得到排序結果。由此,排序引擎在對搜索到的搜索結果進行排序時,不必使用全部排序特征,而可以使用部分排序特征,從而可以減少引擎的計算資源消耗,并且使得引擎可以抵抗來自流量激增的壓力,在流量激增時不會造成太大的搜索延時。
技術領域
本公開涉及搜索領域,特別是涉及一種搜索方法、裝置以及設備。
背景技術
搜索結果排序一般是建立在多種排序特征之上的。隨著近年來深度模型的廣泛應用,越來越多復雜且耗時的特征,作為排序特征被引入到搜索排序中。這一方面帶來了排序效果上的收益,另一方面,也對線上引擎的性能帶來了新的挑戰。這樣的挑戰不僅來自于高耗時排序策略無法全量生效,也來自于突發性高流量事件對引擎的瞬間壓力。
面對大規模流量請求時,為了降低對引擎的壓力,避免出現因引擎的處理能力不足導致搜索結果顯示延時,目前通常是引擎端執行臨時性的降級方案,比如,下線不重要業務、減少召回數量、通過粗排過濾更多搜索結果等方法。可以看到,現有方案的實質是對排序效果的硬妥協(hard?compromise),而不是通過一些軟性(softer)的方法來完成性能的優化。
發明內容
本公開的一個目的在于提出一種能夠在不顯著降低排序效果的前提下,降低引擎壓力的搜索方案。
根據本公開的第一個方面,提出了一種搜索方法,包括:基于用戶信息和搜索請求,從特征集中選取部分排序特征,其中,特征集中的排序特征為對搜索結果進行排序時所使用的特征;以及基于部分排序特征對響應于搜索請求執行搜索而得到的搜索結果進行排序,以得到排序結果。
可選地,從特征集中選取部分排序特征的步驟包括:以基于選取的排序特征得到的排序結果與標準結果之間的差異不大于預定閾值為目標,從特征集中選取排序特征,其中,標準結果為使用特征集中的全部排序特征對響應于搜索請求執行搜索而得到的搜索結果進行排序所得到的排序結果。
可選地,從特征集中選取部分排序特征的步驟包括:基于用戶信息和搜索請求,確定預測模型的模型參數;基于模型參數,使用預測模型預測部分排序特征。
可選地,模型參數包括與用戶信息和搜索請求相對應的參數,確定預測模型的模型參數的步驟包括:從預先訓練好的多個對應于不同預測模型的模型參數中,選取與用戶信息和搜索請求相匹配的模型參數。
可選地,預測模型包括馬爾科夫決策模型,確定部分排序特征的步驟包括:基于確定的模型參數,抽取當前決策狀態;基于當前決策狀態,預測模型按照預定順序對特征集中不同的排序特征的動作進行預測,以得到最終的決策狀態,其中,動作包括特征保留動作和特征丟棄動作,所有特征保留動作所對應的排序特征,即為部分排序特征。
可選地,當前決策狀態包括用戶特征信息和歷史動作信息,其中,用戶特征信息包括用戶信息和搜索請求信息,歷史動作信息包括歷史決策狀態中針對排序特征的動作做出的決策結果。
可選地,馬爾科夫決策模型的獎賞包括第一獎賞和第二獎賞,第一獎賞為針對排序效果的獎賞,第二獎賞用于表征減少的計算開銷。
可選地,所述第一獎賞為
其中,T(sk,ak)表示在狀態sk下采取動作ak的第一獎賞,t為排序結果與標準結果的差異,C為預定閾值,rp為排序結果與標準結果的差異t大于預定閾值C時的懲罰。
可選地,所述第二獎賞為
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810751704.0/2.html,轉載請聲明來源鉆瓜專利網。





