[發明專利]排序模型的生成方法、搜索結果的排序方法、裝置及設備有效
| 申請號: | 201811260257.5 | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN109299344B | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 羅月 | 申請(專利權)人: | OPPO廣東移動通信有限公司 |
| 主分類號: | G06F16/9038 | 分類號: | G06F16/9038;G06F16/953 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 牟慧仙 |
| 地址: | 523860 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 排序 模型 生成 方法 搜索 結果 裝置 設備 | ||
本申請實施例提供了排序模型的生成方法、搜索結果的排序方法、裝置及設備。該方法包括:獲取多組訓練樣本;其中,每組訓練樣本包括一次搜索操作對應的樣本搜索詞及其至少一個搜索結果,以及每個搜索結果標注的排序優先度;對于每一組訓練樣本,獲取樣本搜索詞的各個搜索結果對應的n個維度的特征向量;采用多組訓練樣本對機器學習排序模型進行訓練,得到完成訓練的機器學習排序模型。在本申請實施例中,通過將人工擬合排序公式所涉及的排序因子轉換為機器學習排序模型的特征因子,即便是在特征因子的數量較多或者特征因子發生變化時,均可自動化地訓練得到機器學習排序模型,減少時間和人力成本,且有助于提升對搜索結果進行排序的準確度。
技術領域
本申請實施例涉及搜索技術領域,特別涉及一種排序模型的生成方法、搜索結果的排序方法、裝置及設備。
背景技術
一個搜索引擎的性能好壞,除了體現在搜索結果的準確性之外,還體現在對搜索結果的排序的準確性方面。
在相關技術中,排序算法會預先設置多個排序因子,然后基于上述排序因子人工擬合排序公式。在獲得某個搜索詞的多個搜索結果之后,通過上述排序公式計算每個搜索結果對應的得分,按照得分由高到低的順序對上述多個搜索結果進行排序。
當排序因子的數量較多或者排序因子發生變化時,人工擬合的成本較高,且準確度也難以得到保證。
發明內容
本申請實施例提供一種排序模型的生成方法、搜索結果的排序方法、裝置及設備。所述技術方案如下:
一方面,本申請實施例提供一種排序模型的生成方法,所述方法包括:
獲取多組訓練樣本;其中,每組訓練樣本包括一次搜索操作對應的樣本搜索詞及其至少一個搜索結果,以及每個搜索結果標注的排序優先度;
對于每一組訓練樣本,獲取所述樣本搜索詞的各個所述搜索結果對應的n個維度的特征向量,所述n為大于1的整數;
采用所述多組訓練樣本對機器學習排序模型進行訓練,得到完成訓練的所述機器學習排序模型;其中,所述機器學習排序模型用于根據所述樣本搜索詞的各個所述搜索結果對應的n個維度的特征向量以及所述n個維度各自對應的權重,計算所述樣本搜索詞的各個所述搜索結果對應的排序優先度。
另一方面,本申請實施例提供一種搜索結果的排序方法,所述方法包括:
獲取目標搜索操作對應的目標搜索詞及其至少一個搜索結果;
獲取所述目標搜索詞的各個所述搜索結果對應的n個維度的特征向量,所述n為大于1的整數;
調用機器學習排序模型,根據所述目標搜索詞的各個所述搜索結果對應的n個維度的特征向量以及所述n個維度各自對應的權重,計算所述目標搜索詞的各個所述搜索結果對應的排序優先度;
根據所述目標搜索詞的各個所述搜索結果對應的排序優先度,對所述目標搜索詞的各個所述搜索結果進行排序。
再一方面,本申請實施例提供一種排序模型的生成裝置,所述裝置包括:
樣本獲取模塊,用于獲取多組訓練樣本;其中,每組訓練樣本包括一次搜索操作對應的樣本搜索詞及其至少一個搜索結果,以及每個搜索結果標注的排序優先度;
特征獲取模塊,用于對于每一組訓練樣本,獲取所述樣本搜索詞的各個所述搜索結果對應的n個維度的特征向量,所述n為大于1的整數;
模型訓練模塊,用于采用所述多組訓練樣本對機器學習排序模型進行訓練,得到完成訓練的所述機器學習排序模型;其中,所述機器學習排序模型用于根據所述樣本搜索詞的各個所述搜索結果對應的n個維度的特征向量以及所述n個維度各自對應的權重,計算所述樣本搜索詞的各個所述搜索結果對應的排序優先度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于OPPO廣東移動通信有限公司,未經OPPO廣東移動通信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811260257.5/2.html,轉載請聲明來源鉆瓜專利網。





