[發明專利]搜索詞和商品的相關性預測方法、設備和存儲介質有效
| 申請號: | 202010699655.8 | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN111737418B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 王江偉 | 申請(專利權)人: | 北京每日優鮮電子商務有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F16/9535;G06Q30/06 |
| 代理公司: | 北京華專卓海知識產權代理事務所(普通合伙) 11664 | 代理人: | 王一 |
| 地址: | 100102 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索詞 商品 相關性 預測 方法 設備 存儲 介質 | ||
1.一種搜索詞和商品的相關性預測方法,其特征在于,包括:
接收當前用戶輸入的搜索詞,確定所述搜索詞的語義向量,所述語義向量用于表征所述搜索詞在詞典的語義向量空間中的位置,其中所述語義向量空間由以下方式生成:獲取用戶的歷史搜索行為日志中的搜索詞、商品名和品類名;對搜索詞、商品名和品類名進行逐行編碼,生成語義向量空間,其中搜索詞、商品名和品類名的編碼為各自對應的行號;所述品類名包括多個級別的品類名,每個級別的品類名對應所述語義向量空間的一個維度;
利用預先訓練的搜索推薦模型,確定所述搜索詞的語義向量對應的至少一個搜索結果項,所述搜索結果項為包括所述搜索詞,以及與所述搜索詞的相關性大于預設閾值的商品名和品類名的語義向量;所述搜索推薦模型由以下方式生成:獲取預設時間段內的用戶的行為日志,所述行為日志包括用戶的搜索請求和用戶對根據搜索請求返回的商品信息的響應動作; 將點擊率高于預設閾值的商品信息對應的搜索詞、以及商品信息中的商品名和品類名作為訓練正樣本;將點擊率低于預設閾值的商品信息對應的搜索詞、以及商品信息中的商品名和品類名作為第一子訓練負樣本;按照預設條件從所述訓練正樣本所屬品類和上級品類中選取商品信息對應的搜索詞、以及商品信息中的商品名和品類名作為第二子訓練負樣本;將所述第一子訓練負樣本和所述第二子訓練負樣本直接融合,生成訓練負樣本,或者將所述第一子訓練負樣本和所述第二子訓練負樣本按比例融合,生成訓練負樣本,根據兩個訓練負樣本對應的搜索模型的推薦結果的準確度對搜索推薦模型的訓練負樣本進行優化,作為最終的訓練負樣本;在所述訓練正樣本和所述訓練負樣本中關聯加入品類特征,生成特征訓練正樣本和特征訓練負樣本,并映射為語義向量空間中的語義向量;利用所述特征訓練正樣本和所述特征訓練負樣本的語義向量對神經網絡模型進行訓練,生成搜索推薦模型;
確定所述搜索結果項在詞典的語義向量空間中的位置,并確定對應的商品信息;
將所述商品信息推薦給所述當前用戶。
2.根據權利要求1所述的搜索詞和商品的相關性預測方法,其特征在于,還包括:
從所述訓練正樣本所屬的不同品類下選取預設比例的商品信息對應的搜索詞、以及商品信息中的商品名和品類名作為第三子訓練負樣本;
所述將所述第一子訓練負樣本和所述第二子訓練負樣本進行融合,生成訓練負樣本,包括:
將所述第一子訓練負樣本、所述第二子訓練負樣本和所述第三子訓練負樣本進行融合,生成訓練負樣本。
3.根據權利要求2所述的搜索詞和商品的相關性預測方法,其特征在于,所述搜索推薦模型為FM模型、FFM模型、雙線性FFM模型和DeepFFM模型中的一種。
4.根據權利要求3所述的搜索詞和商品的相關性預測方法,其特征在于,所述語義向量空間還包括用戶信息維度,所述用戶信息包括用戶ID、用戶性別和用戶職業中的至少一種。
5.根據權利要求4所述的搜索詞和商品的相關性預測方法,其特征在于,所述接收當前用戶輸入的搜索詞,確定所述搜索詞的語義向量,包括:
接收當前用戶輸入的搜索詞,獲取所述當前用戶的用戶信息,確定所述搜索詞和所述用戶信息的語義向量。
6.一種電子設備,包括存儲器和處理器,所述存儲器上存儲有計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1~5中任一項所述的方法。
7.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行時實現如權利要求1~5中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京每日優鮮電子商務有限公司,未經北京每日優鮮電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010699655.8/1.html,轉載請聲明來源鉆瓜專利網。





