[發明專利]一種POI搜索排序模型訓練方法、排序裝置與方法及介質有效
| 申請號: | 202010496959.4 | 申請日: | 2020-06-03 |
| 公開(公告)號: | CN113761084B | 公開(公告)日: | 2023-08-08 |
| 發明(設計)人: | 王鵬;楊煥星;趙楠;李玉彬;劉樹明;趙帥領;王濤;王濤;馬海軍;王珂;蘇曉朋 | 申請(專利權)人: | 北京四維圖新科技股份有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/248 |
| 代理公司: | 北京國科程知識產權代理事務所(普通合伙) 11862 | 代理人: | 曹曉斐 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 poi 搜索 排序 模型 訓練 方法 裝置 介質 | ||
1.一種基于深度學習的POI搜索排序模型訓練方法,其特征在于,包括:
獲取搜索條目樣本以及所述搜索條目樣本對應的搜索結果樣本;
利用神經網絡模型將所述搜索條目樣本以及所述搜索結果樣本進行向量表示,建立預訓練向量樣本庫;以及
通過將所述預訓練向量樣本庫輸入到語義匹配模型進行運算獲取所述搜索條目樣本與所述搜索結果樣本之間的相似度,獲得所述POI搜索排序模型,其中,
將根據所述搜索結果樣本的曝光點擊率進行擬合得到的函數作為所述POI搜索排序模型的歸一化折損累計增益函數中的基準增益函數,其中所述歸一化折損累計增益函數為所述基準增益函數為2r(j)-1,所述搜索條目樣本包括所述搜索條目的點擊量數據,所述搜索結果樣本包括所述搜索結果的點擊量數據,其中根據從日志統計出的所述搜索結果樣本的點擊數據和位置數據獲得所述曝光點擊率。
2.如權利要求1所述的基于深度學習的POI搜索排序模型訓練方法,其特征在于,所述建立預訓練向量樣本庫的過程還包括,利用所述神經網絡模型將與所述搜索條目樣本相關的搜索特征樣本進行向量表示。
3.如權利要求2所述的基于深度學習的POI搜索排序模型訓練方法,其特征在于,所述搜索特征樣本包括用戶行為特征、用戶身份特征和第三特征中的至少一個,所述用戶行為特征包括用戶在搜索過程中的點擊行為和篩選行為。
4.如權利要求3所述的基于深度學習的POI搜索排序模型訓練方法,其特征在于,將稀疏的用戶身份信息進行聚類獲得所述用戶身份特征,所述用戶身份特征包括用戶所在地信息以及用戶行程信息。
5.如權利要求2所述的基于深度學習的POI搜索排序模型訓練方法,其特征在于,利用局部可解釋性,確定不同的所述搜索特征樣本對所述POI搜索排序模型排序結果的影響程度。
6.一種基于深度學習的POI搜索排序裝置,其特征在于,包括基于深度學習的POI搜索排序模型,還包括:
搜索結果召回模塊,其將輸入的搜索問題所對應的搜索結果候選集進行召回;
細粒度排序模塊,其在所述搜索結果候選集的大小低于預定閾值的情況下,則,
利用所述基于深度學習的POI搜索排序模型對所述搜索結果候選集中的搜索結果進行細粒度排序,獲得第一細粒度排序搜索結果;
在所述搜索結果候選集的大小不低于所述預定閾值的情況下,則,
對所述搜索結果候選集中的搜索結果使用基于非深度學習的快速排序模型進行粗粒度排序,獲得粗粒度排序搜索結果,
對所述粗粒度排序搜索結果利用所述基于深度學習的POI搜索排序模型進行細粒度排序,獲得第二細粒度排序搜索結果;以及
排序搜索結果微調模塊,其根據業務邏輯,對所述第一細粒度排序搜索結果或所述第二細粒度排序搜索結果進行微調,獲得擬輸出的排序搜索結果,其中所述POI搜索排序模型的訓練過程包括:
獲取搜索條目樣本以及所述搜索條目樣本對應的搜索結果樣本;
利用神經網絡模型將所述搜索條目樣本以及所述搜索結果樣本進行向量表示,建立預訓練向量樣本庫;以及
通過將所述預訓練向量樣本庫輸入到語義匹配模型進行運算獲取所述搜索條目樣本與所述搜索結果樣本之間的相似度,獲得所述POI搜索排序模型,其中,
將根據所述搜索結果樣本的曝光點擊率進行擬合得到的函數作為所述POI搜索排序模型的歸一化折損累計增益函數中的基準增益函數,其中所述歸一化折損累計增益函數為所述基準增益函數為2r(j)-1,所述搜索條目樣本包括所述搜索條目的點擊量數據,所述搜索結果樣本包括所述搜索結果的點擊量數據,其中根據從日志統計出的所述搜索結果樣本的點擊數據和位置數據獲得所述曝光點擊率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京四維圖新科技股份有限公司,未經北京四維圖新科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010496959.4/1.html,轉載請聲明來源鉆瓜專利網。





