[發明專利]搜索排序方法、裝置、計算機設備和存儲介質有效
| 申請號: | 201810848395.9 | 申請日: | 2018-07-27 |
| 公開(公告)號: | CN108959644B | 公開(公告)日: | 2020-04-14 |
| 發明(設計)人: | 彭釗 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/338 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 排序 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種搜索排序方法,其特征在于,所述方法包括:
獲取搜索關鍵詞,確定與多個所述搜索關鍵詞匹配的多個初始檢索結果;其中,所述初始檢索結果包括聯系人、群或消息;所述初始檢索結果的字段中包括對象類型、對象狀態、對象名稱、初始召回搜索引擎分數、聊天更新時間、最近一條消息位置、對象拼音名、對象英文名、所在部門中的至少一種信息;所述對象類型包括聊天應用和/或郵件;所述對象狀態包括是否注冊和/或是否離職;
根據所述初始檢索結果,提取文本相似度、更新時間維度和聯系人客觀重要度;其中,所述文本相似度用于表征所述搜索關鍵詞與搜索結果匹配程度,所述更新時間維度用于表征搜索結果聊天記錄更新情況,所述聯系人客觀重要度用于表征公眾對所述搜索結果的評價高低;所述聯系人客觀重要度由公眾評價數據確定;
根據文本相似度、更新時間維度和聯系人客觀重要度,獲取對應的文本相似度權重、更新時間維度權重和聯系人客觀重要度權重;
根據所述文本相似度權重、更新時間維度權重和聯系人客觀重要度權重對每個所述初始檢索結果進行融合計算,得到每個所述初始檢索結果的綜合權值;
根據所述綜合權值對所述多個初始檢索結果進行排序;
其中,所述根據所述文本相似度權重、更新時間維度權重和聯系人客觀重要度權重進行融合計算,得到每個所述初始檢索結果的綜合權值包括:
根據所述文本相似度權重、更新時間維度權重和聯系人客觀重要度權重分別獲取偏移值和修正值;
分別計算文本相似度權重、更新時間維度權重和聯系人客觀重要度權重與與其對應的所述偏移值之積再與與其對應的所述修正值之和得到融合系數;
將所述融合系數相乘,得到每個所述初始檢索結果的綜合權值;
其中,所述偏移值和修正值由機器學習確定;所述偏移值和所述修正值用于表示重要程度;
其中,在提取每個所述初始檢索結果相關的文本相似度、更新時間維度和聯系人客觀重要度之前,包括:
對所述初始檢索結果進行篩選,包括:
對離職用戶且無聊天記錄的初始檢索結果不進行排序;
將未注冊用戶的初始檢索結果排在最后。
2.根據權利要求1所述的方法,其特征在于,所述獲取文本相似度權重包括:
計算所述關鍵詞在所述初始檢索結果中的命中率、順序一致性指標、位置緊密度和覆蓋率;
根據所述命中率、順序一致性指標、位置緊密度和覆蓋率,計算文本相似度權重。
3.根據權利要求2所述的方法,其特征在于,所述根據所述命中率、順序一致性指標、位置緊密度和覆蓋率計算文本相似度權重的步驟包括:
根據所述命中率、順序一致性指標、位置緊密度和覆蓋率分別獲取偏移值和修正值;
根據所述命中率、順序一致性指標、位置緊密度和覆蓋率和對應的所述偏移值和修正值進行融合計算,得到文本相似度權重。
4.根據權利要求1所述的方法,其特征在于,所述獲取更新時間維度權重包括:
根據所述初始檢索結果,獲取最后一次聊天時間距離當前時間的時間間隔;
計算衰減常數與所述時間間隔與所述衰減常數之和的比值,得到所述更新時間維度權重。
5.根據權利要求1所述的方法,其特征在于,所述獲取聯系人客觀重要度權重包括:
獲取所述搜索結果職位級別、發表文章數目比值、受關注數據和點贊數據;
根據所述職位級別、發表文章數目比值、受關注數據和點贊數據,計算聯系人客觀重要度權重。
6.根據權利要求5所述的方法,其特征在于,所述根據所述職位級別、發表文章數目比值、受關注數據和點贊數據,計算聯系人客觀重要度權重包括:
根據所述職位級別、發表文章數目比值、受關注數據和點贊數據分別獲取偏移值和修正值;
根據所述職位級別、發表文章數目比值、受關注數據和點贊數據和對應的所述偏移值和修正值進行融合計算,得到聯系人客觀重要度權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810848395.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:生成標簽的方法、裝置、服務器和存儲介質
- 下一篇:一種政策法規收集分析系統





