[發明專利]用于優化搜索排序的方法、裝置及電子設備有效
| 申請號: | 201711474923.0 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN110020173B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 王路路 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/02 |
| 代理公司: | 北京清源匯知識產權代理事務所(特殊普通合伙) 11644 | 代理人: | 馮德魁;竇曉慧 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 優化 搜索 排序 方法 裝置 電子設備 | ||
1.一種用于優化搜索排序的方法,其特征在于,包括:
在搜索排序基礎公式中引入超參數,得到搜索排序擴展公式;
根據所述搜索排序擴展公式,使用訓練樣本進行計算,通過最大化搜索排序序關系準確度指標,得到用于優化搜索排序的優選超參數,所述訓練樣本,由資源的曝光點擊日志中獲得,包括正樣本和負樣本,其中,用戶看到該資源為一個訓練樣本,用戶看到該資源并進行了點擊為正樣本,用戶看到該資源未進行點擊,是負樣本;
使用所述優選超參數對搜索排序進行優化;
其中,所述搜索排序為RPM排序;所述搜索排序基礎公式為RPM基礎排序公式;所述搜索排序擴展公式為RPM擴展排序公式;所述搜索排序序關系準確度指標,是根據訓練樣本的損失函數構造的RPM序關系準確度指標AUCrpm。
2.根據權利要求1所述的用于優化搜索排序的方法,其特征在于,所述使用所述優選超參數對搜索排序進行優化,包括:使用所述優選超參數,在線計算RPM排序。
3.根據權利要求1所述的用于優化搜索排序的方法,其特征在于,所述AUCrpm,通過下述方式定義:
根據訓練樣本的預估排序與實際點擊排序不一致而產生的預估排序錯誤得到預估排序損失;
使用所述預估排序損失的最大值作為歸一化因子,對所述預估排序損失進行歸一化運算得到AUCrpm;其中,所述歸一化運算采用下述公式:AUCrpm等于所述歸一化因子減去預估排序損失,得到的差值再除以歸一化因子。
4.根據權利要求3所述的用于優化搜索排序的方法,其特征在于,所述超參數,至少包括下述任一參數:
全局調控因子,用于全局調控,通過使得訓練樣本的RPM序關系準確度指標AUCrpm達到最大值,從而得到優化RPM排序的全局調控因子;
點擊率預估校準因子,用于使得點擊率預估逼近真實點擊率,通過基于訓練樣本分段調節點擊率預估的系統偏差,從而得到優化RPM排序的點擊率預估校準因子。
5.根據權利要求4所述的用于優化搜索排序的方法,其特征在于,所述通過使得訓練樣本的RPM序關系準確度指標AUCrpm達到最大值,從而得到優化RPM排序的全局調控因子,包括:
采取剪枝策略和啟發式策略計算出所述全局調控因子。
6.根據權利要求5所述的用于優化搜索排序的方法,其特征在于,所述采取剪枝策略和啟發式策略計算出所述全局調控因子,包括下述處理:
根據人工經驗確定所述全局調控因子的范圍和遍歷步長;
按照所述遍歷步長,在所述全局調控因子的范圍內,基于所述訓練樣本計算得出當RPM序關系準確度指標AUCrpm取得最大值時的優選全局調控因子。
7.根據權利要求4所述的用于優化搜索排序的方法,其特征在于,所述通過基于訓練樣本分段調節點擊率預估的系統偏差,從而得到優化RPM排序的點擊率預估校準因子,包括下述處理:
將訓練樣本按照點擊率預估分桶;
點擊率預估校準目標為,使得各桶內的訓練樣本的點擊率預估平均值和實際點擊率統計值之差的平方和最小,從而計算出各個桶的點擊率預估校準因子;其中,所述點擊率預估的平均值計算公式為:桶內的所有樣本的點擊率預估求和后,再除以桶內的樣本數;所述實際點擊率統計值計算公式為:實際點擊總數量,除以頁面訪問總數量。
8.根據權利要求7所述的用于優化搜索排序的方法,其特征在于,所述將訓練樣本按照點擊率預估分桶,包括采用下述方法:
將點擊率預估百分位大于0.95的那些點擊率預估放到最后一個桶中;
其他點擊率預估進行等距分桶。
9.根據權利要求8所述的用于優化搜索排序的方法,其特征在于,所述將訓練樣本按照點擊率預估分桶,包括采用人工經驗確定桶的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711474923.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:搜索結果生成方法和裝置
- 下一篇:針對網絡安全信息的海量數據挖掘系統





