[發明專利]搜索結果排序模型的訓練與搜索結果排序方法、裝置有效
| 申請號: | 202210744647.X | 申請日: | 2022-06-27 |
| 公開(公告)號: | CN115186163B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 王海峰;田浩;吳華;吳甜;劉璟;陳維政;戴岱;王佳康;龐超;王文華 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/38;G06N3/04;G06N3/08 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 孟繁琦 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 結果 排序 模型 訓練 方法 裝置 | ||
本公開提供了一種搜索結果排序模型的訓練與搜索結果排序方法,涉及自然語言處理、深度學習等領域。包括:獲取多個第一數據對、多個第一數據對中搜索結果對應多個搜索目標的單目標特征、多個第一數據對分別對應多個搜索目標的標注得分;基于上述獲取的數據,訓練得到多個單搜索目標排序模型;獲取多個第二數據對、多個第二數據對中的每個搜索結果對應全部搜索目標的多目標特征;使用與多個搜索目標對應的多個單搜索目標排序模型對第二數據對中的每個搜索結果進行打分,確定第二數據對的訓練搜索目標;基于多個第二數據對中的查詢詞、每個搜索結果對應全部搜索目標的多目標特征、每個搜索結果對應訓練搜索目標的得分,訓練得到搜索結果排序模型。
技術領域
本公開涉及計算機技術領域,尤其涉及自然語言處理、深度學習等人工智能技術領域。具體涉及一種搜索結果排序模型的訓練與搜索結果排序方法、裝置、電子設備和可讀存儲介質。
背景技術
隨著搜索引擎技術的快速發展,用戶越來越多地通過搜索引擎進行搜索的方式來獲取各種各樣的搜索結果。在面對海量的搜索結果時,就會涉及到排序問題,即依據搜索結果的排序結果向用戶進行展示。
發明內容
根據本公開的第一方面,提供了一種搜索結果排序模型的訓練方法,包括:獲取多個第一數據對、所述多個第一數據對中的搜索結果分別對應多個搜索目標的單目標特征以及所述多個第一數據對分別對應所述多個搜索目標的標注得分,每個第一數據對包含查詢詞及其對應的一個搜索結果;針對每個搜索目標,基于所述多個第一數據對中的查詢詞、所述多個第一數據對中的搜索結果對應該搜索目標的單目標特征以及所述多個第一數據對對應該搜索目標的標注得分,訓練第一預訓練語言模型,得到與該搜索目標對應的單搜索目標排序模型;獲取多個第二數據對以及所述多個第二數據對中的每個搜索結果對應全部搜索目標的多目標特征,每個第二數據對包含查詢詞及其對應的兩個搜索結果;針對每個第二數據對,使用與所述多個搜索目標對應的多個單搜索目標排序模型對該第二數據對中的每個搜索結果進行打分,根據所述每個搜索結果對應所述多個搜索目標的得分,確定該第二數據對的訓練搜索目標;基于所述多個第二數據對中的查詢詞、所述多個第二數據對中的每個搜索結果對應全部搜索目標的多目標特征以及所述多個第二數據對中的每個搜索結果對應所述訓練搜索目標的得分,訓練第二預訓練語言模型,得到搜索結果排序模型。
根據本公開的第二方面,提供了一種搜索結果排序方法,包括:獲取待處理查詢詞及其對應的多個搜索結果;針對每個搜索結果,獲取該搜索結果對應全部搜索目標的多目標特征;針對每個搜索結果,將所述待處理查詢詞與該搜索結果對應全部搜索目標的多目標特征輸入搜索結果排序模型,得到所述搜索結果排序模型針對該搜索結果輸出的得分;根據所述多個搜索結果的得分,對所述多個搜索結果進行排序。
根據本公開的第三方面,提供了一種搜索結果排序模型的訓練裝置,包括:第一獲取單元,用于獲取多個第一數據對、所述多個第一數據對中的搜索結果分別對應多個搜索目標的單目標特征以及所述多個第一數據對分別對應所述多個搜索目標的標注得分,每個第一數據對包含查詢詞及其對應的一個搜索結果;第一訓練單元,用于針對每個搜索目標,基于所述多個第一數據對中的查詢詞、所述多個第一數據對中的搜索結果對應該搜索目標的單目標特征以及所述多個第一數據對對應該搜索目標的標注得分,訓練第一預訓練語言模型,得到與該搜索目標對應的單搜索目標排序模型;第二獲取單元,用于獲取多個第二數據對以及所述多個第二數據對中的每個搜索結果對應全部搜索目標的多目標特征,每個第二數據對包含查詢詞及其對應的兩個搜索結果;處理單元,用于針對每個第二數據對,使用與所述多個搜索目標對應的多個單搜索目標排序模型對該第二數據對中的每個搜索結果進行打分,根據所述每個搜索結果對應所述多個搜索目標的得分,確定該第二數據對的訓練搜索目標;第二訓練單元,用于基于所述多個第二數據對中的查詢詞、所述多個第二數據對中的每個搜索結果對應全部搜索目標的多目標特征以及所述多個第二數據對中的每個搜索結果對應所述訓練搜索目標的得分,訓練第二預訓練語言模型,得到搜索結果排序模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210744647.X/2.html,轉載請聲明來源鉆瓜專利網。





