[發明專利]搜索方法、裝置及電子設備有效
| 申請號: | 202010329527.4 | 申請日: | 2020-04-24 |
| 公開(公告)號: | CN111222052B | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 鄭培祥;段超;蔡明宸;劉忠義;張翼;李濤 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 周嗣勇 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 方法 裝置 電子設備 | ||
1.一種搜索方法,所述方法包括:
獲取用戶輸入的搜索數據樣本,在用戶的每次字符輸入時為用戶推薦的搜索模式,以及與所述搜索數據樣本對應的搜索時長;其中,所述搜索數據樣本包括按照輸入時刻排序的輸入字符序列;所述搜索模式包括直接搜索模式和建議詞搜索模式,所述直接搜索模式為在用戶輸入的搜索數據的過程中向用戶輸出與已輸入字符對應的實時搜索結果的搜索模式,所述建議詞搜索模式為在用戶輸入的搜索數據的過程中向用戶輸出與輸入字符相關的建議詞并在用戶選擇該建議詞后基于該建議詞發起數據搜索的搜索模式;所述搜索時長表征從用戶開始輸入字符到得到搜索結果的時間差;
將所述搜索數據樣本中的輸入字符作為狀態,在用戶輸入該輸入字符時為用戶推薦的搜索模式作為動作,生成狀態動作對,并將所述搜索時長作為與所述狀態動作對對應的回報,對預設的強化學習模型進行強化學習訓練,得到搜索決策模型;
響應于用戶輸入的搜索數據,將用戶每次輸入的輸入字符輸入訓練完成的所述搜索模式決策模型進行推薦計算,并將當前的搜索模式切換為所述搜索模式決策模型輸出的搜索模式,以使用戶基于所述搜索模式決策模型輸出的搜索模式執行搜索。
2.根據權利要求1所述的方法,所述在用戶的每次字符輸入時為用戶推薦的搜索模式,為在用戶的每次字符輸入時為用戶隨機推薦的搜索模式。
3.根據權利要求1所述的方法,所述強化學習模型的回報函數的回報衰減因子為動態值。
4.根據權利要求3所述的方法,所述強化學習模型的回報函數的回報衰減因子,為基于所述搜索數據中的所有字符輸入完成時的最大輸入次數確定出的動態值。
5.根據權利要求4所述的方法,所述強化學習模型為深度強化學習模型;其中,所述深度強化學習模型包括用于擬合回報函數的衰減因子的深度學習網絡;
所述對預設的強化學習模型進行強化學習訓練,包括:
基于所述狀態動作對和所述搜索時長構建訓練樣本,基于構建的訓練樣本對預設的強化學習模型進行強化學習訓練,確定所述強化學習模型的回報函數中的模型參數;以及,
確定所述搜索數據樣本中的最大字符輸入次數,至少將所述最大字符輸入次數作為輸入數據輸入至所述深度學習網絡進行數據擬合,確定所述回報函數中的衰減因子。
6.根據權利要求5所述的方法,所述回報函數基于以下公式表征:
其中, 為j時刻對應狀態動作對的搜索時長; 為j+1時刻狀態;表征該深度強化學習模型的模型參數;a′表征j時刻狀態到j+1時刻狀態所對應選擇的動作,該動作為搜索模式,該搜索模式為直接搜索模式或者建議詞搜索模式;f為用于表征擬合替代回報函數的衰減因子的深度學習網絡;index表征用戶輸入搜索數據過程中的第index次輸入,max_index表征用戶完成輸入搜索數據中的所有字符輸入時的最大輸入次數。
7.根據權利要求1所述的方法,還包括:
在用戶輸入的搜索數據前,將當前的搜索模式默認設置為建議詞搜索模式。
8.根據權利要求1所述的方法,所述響應于用戶輸入的搜索數據,將用戶每次輸入的輸入字符輸入訓練完成的所述搜索模式決策模型進行推薦計算,并將當前的搜索模式切換為所述搜索模式決策模型輸出的搜索模式,以使用戶基于所述搜索模式決策模型輸出的搜索模式執行搜索,包括:
響應于用戶輸入的搜索數據,將用戶每次輸入的輸入字符輸入訓練完成的所述搜索模式決策模型進行推薦計算,在當前的搜索模式為建議詞搜索模式且所述搜索模式決策模型輸出的搜索模式為直接搜索模式時,將當前的搜索模式從建議詞搜索模式切換為直接搜索模式,以使用戶基于切換后的直接搜索模式直接獲得對應的搜索結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010329527.4/1.html,轉載請聲明來源鉆瓜專利網。





