[發明專利]一種確定搜索結果相關度的方法及裝置在審
| 申請號: | 202210430969.7 | 申請日: | 2022-04-22 |
| 公開(公告)號: | CN114880528A | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 沈元;校婭;朱迪;許曉燕;湯彪 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06F16/9032 | 分類號: | G06F16/9032;G06F40/126 |
| 代理公司: | 北京曼威知識產權代理有限公司 11709 | 代理人: | 鄧超 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 確定 搜索 結果 相關 方法 裝置 | ||
本說明書公開了一種確定搜索結果相關度的方法及裝置。確定用戶的查詢結果及其對應的搜索結果的結果文本,以將查詢文本及結果文本輸入相關度模型的編碼模塊,確定查詢文本對應的第一特征及結果文本對應的第二特征。通過相關度模型的交互模塊,根據第一特征及第二特征,確定查詢文本與結果文本分別在預設的各計算方式下的相似性矩陣,并針對每個相似性矩陣,根據第一特征及該相似性矩陣,確定查詢文本與結果文本在該相似性矩陣對應的計算方式下的相關度特征,以基于各相關度特征,通過相關度模型的融合模塊,確定查詢文本與搜索結果的相關度。能夠基于具有泛化能力的相關度模型分析文本的語義,更準確識別查詢文本與結果文本的相關度。
技術領域
本說明書涉及數據處理技術領域,尤其涉及一種確定搜索結果相關度的方法及裝置。
背景技術
作為獲取信息的重要渠道,網絡可供用戶根據意愿搜索相應的新聞、商品、服務提供方等,以獲取相關信息或執行業務。提供搜索服務的平臺則需要基于用戶搜索的查詢文本,確定與該查詢文本的搜索結果并推薦給用戶。
平臺推薦的搜索結果與用戶的查詢文本相關度越高,則推薦效果越好,而推薦效果取決于平臺的搜索推薦算法。因此,平臺確定的搜索結果與用戶的查詢文本的相關度可用于評估平臺的搜索技術。
在現有技術中,通常是針對平臺確定的每個搜索結果,通過離散的詞袋模型分別將用戶的查詢文本與該搜索結果的結果文本中各個詞進行編碼得到各個詞的向量,并基于查詢文本與該結果文本兩兩詞之間向量的相似度,確定該查詢文本與該搜索結果整體的相關度。
但詞袋模型對不同的詞編碼不同,現有技術中的相關度是根據詞與詞的編碼之間是否一致得出的,現有技術對相關度的確定并不準確。
發明內容
本說明書提供一種確定搜索結果相關度的方法及裝置,以部分的解決現有技術存在的上述問題。
本說明書采用下述技術方案:
本說明書提供了一種確定搜索結果相關度的方法,包括:
確定查詢文本及其對應的搜索結果的結果文本;
將所述查詢文本以及所述結果文本輸入預先訓練的相關度模型的編碼模塊,確定所述查詢文本對應的第一特征以及所述結果文本對應的第二特征;
通過所述相關度模型的交互模塊,根據所述第一特征以及所述第二特征,確定所述查詢文本與所述結果文本分別在預設的各計算方式下的相似性矩陣,并針對每個相似性矩陣,根據所述第一特征以及該相似性矩陣,確定所述查詢文本與所述結果文本在該相似性矩陣對應的計算方式下的相關度特征;
根據各相關度特征,通過所述相關度模型的融合模塊,確定所述查詢文本與所述搜索結果的相關度。
可選地,所述計算方式包括:基于點積的計算方式、基于余弦距離的計算方式以及基于歐氏距離的計算方式中的至少兩種。
可選地,所述交互模塊包括:第一模塊以及第二模塊;
通過所述相關度模型的交互模塊,根據所述第一特征以及所述第二特征,確定所述查詢文本與所述結果文本分別在預設的各計算方式下的相似性矩陣,具體包括:
通過所述第一模塊,根據所述第一特征,確定第一中間特征,并根據將所述查詢文本輸入所述編碼模塊時對所述查詢文本進行維度填充的位置,對所述第一中間特征中的部分特征添加掩碼,得到第一融合特征;
根據所述第一融合特征以及所述第二特征,通過所述第二模塊,確定所述查詢文本與所述結果文本分別在預設的各計算方式下的相似性矩陣。
可選地,所述交互模塊還包括第三模塊;
針對每個相似性矩陣,根據所述第一特征以及該相似性矩陣,確定所述查詢文本與所述結果文本在該相似性矩陣對應的計算方式下的相關度特征,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210430969.7/2.html,轉載請聲明來源鉆瓜專利網。





