[發明專利]一種多數據類型分層排序方法和裝置有效
| 申請號: | 202110982158.3 | 申請日: | 2021-08-25 |
| 公開(公告)號: | CN113792225B | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 張晨曦 | 申請(專利權)人: | 北京庫??萍加邢薰?/a> |
| 主分類號: | G06F16/9538 | 分類號: | G06F16/9538;G06F16/33;G06F16/35;G06F16/9532 |
| 代理公司: | 北京市鼎立東審知識產權代理有限公司 11751 | 代理人: | 陳佳妹 |
| 地址: | 100012 北京市朝陽區利*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 多數 類型 分層 排序 方法 裝置 | ||
本申請涉及一種多數據類型分層排序方法和裝置,其中方法包括:對接收到的搜索請求進行解析處理和意圖識別,得到相應的結構化語義;根據結構化語義得到相應的搜索結果,并由搜索結果中提取出意圖類搜索結果,對意圖類搜索結果與結構化語義進行語義相似度計算,得到各意圖類搜索結果分別與結構化語義的語義相似度評分;根據各意圖類搜索結果的語義相似度評分和意圖評分,得到各用戶意圖的最終評分;根據各用戶意圖的最終評分,對各用戶意圖進行分層排序,并將各意圖類搜索結果對應相應的各用戶意圖。其能夠根據用戶意圖和結果相關性進行雙向判斷,返回最全面且相關性強的結果,讓用戶可以根據意圖層級分類快速找到所請求的目標服務或內容。
技術領域
本申請涉及網絡數據處理技術領域,尤其涉及一種多數據類型分層排序方法和裝置。
背景技術
搜索引擎技術現已廣泛應用于各個互聯網領域,且以開放搜索、站內搜索等內容型搜索引擎為主。對于不同垂域、不同數據類型搜索結果的排序主要都是基于數據模板區分邊界,按照配置信息的分類優先級進行排序。傳統的搜索技術,無法準確滿足用戶在多意圖時的精準搜索需求,如:用戶在搜索“怒火重案”返回訂電影票類結果和視頻類結果時,應該哪個類別排序在前,哪個類別排序在后。即,傳統的搜索技術很難實現在多意圖情況下的搜索結果的排序,從而不能使得輸出的搜索結果更加符合用戶當前的多意圖需求。
發明內容
有鑒于此,本申請提出了一種多數據類型分層排序方法,可以使得輸出的搜索結果更加符合用戶當前的多意圖需求。
根據本申請的一方面,提供了一種多數據類型分層排序方法,包括:
對接收到的搜索請求進行解析處理和意圖識別,得到相應的結構化語義;其中,所述結構化語義中包含有識別出的用戶意圖及對應的意圖評分;
根據所述結構化語義得到相應的搜索結果,并由所述搜索結果中提取出意圖類搜索結果,對所述意圖類搜索結果與所述結構化語義進行語義相似度計算,得到各所述意圖類搜索結果分別與所述結構化語義的語義相似度評分;
根據各所述意圖類搜索結果的語義相似度評分和所述意圖評分,得到各所述用戶意圖的最終評分;
根據各所述用戶意圖的最終評分,對各所述用戶意圖進行分層排序,并將各所述意圖類搜索結果對應相應的各所述用戶意圖。
在一種可能的實現方式中,根據所述結構化語義得到相應的搜索結果,并由所述搜索結果中提取出意圖類搜索結果,對所述意圖類搜索結果與所述結構化語義進行語義相似度計算時,還包括:
在所述搜索結果中存在有召回的百科類搜索結果時,對所述百科類搜索結果與所述結構化語義進行語義相似度計算。
在一種可能的實現方式中,所述結構化語義中還包括有與所述搜索請求相關的實體詞、分詞、同義詞、糾錯詞中的至少一種;
其中,對接收到的搜索請求進行解析處理時,包括:
由所述搜索請求中提取出搜索關鍵詞,對所述搜索關鍵詞進行關鍵詞處理得到與所述搜索請求相關系的實體詞、分詞、同義詞、糾錯詞中的至少一種。
在一種可能的實現方式中,對接收到的所述搜索請求進行意圖識別時,通過預先訓練的意圖識別網絡模型進行。
在一種可能的實現方式中,在對所述意圖識別網絡模型進行訓練時,使用的訓練樣本數據通過爬蟲獲取;
其中,在通過爬蟲獲取訓練樣本數據后,還按照所述訓練樣本數據所屬應用的爬取路徑進行意圖標注。
在一種可能的實現方式中,根據各所述意圖類搜索結果的語義相似度評分和所述意圖評分,得到各所述用戶意圖的最終評分時,通過加權計算的方式進行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京庫??萍加邢薰?,未經北京庫睿科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110982158.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種渣锍全自動剝離裝置
- 下一篇:一種融合孿生網絡與相關濾波的目標跟蹤方法





