[發(fā)明專利]搜索方法、裝置及電子設(shè)備有效
| 申請?zhí)枺?/td> | 202010329527.4 | 申請日: | 2020-04-24 |
| 公開(公告)號: | CN111222052B | 公開(公告)日: | 2020-08-11 |
| 發(fā)明(設(shè)計)人: | 鄭培祥;段超;蔡明宸;劉忠義;張翼;李濤 | 申請(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 周嗣勇 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 搜索 方法 裝置 電子設(shè)備 | ||
1.一種搜索方法,所述方法包括:
獲取用戶輸入的搜索數(shù)據(jù)樣本,在用戶的每次字符輸入時為用戶推薦的搜索模式,以及與所述搜索數(shù)據(jù)樣本對應的搜索時長;其中,所述搜索數(shù)據(jù)樣本包括按照輸入時刻排序的輸入字符序列;所述搜索模式包括直接搜索模式和建議詞搜索模式,所述直接搜索模式為在用戶輸入的搜索數(shù)據(jù)的過程中向用戶輸出與已輸入字符對應的實時搜索結(jié)果的搜索模式,所述建議詞搜索模式為在用戶輸入的搜索數(shù)據(jù)的過程中向用戶輸出與輸入字符相關(guān)的建議詞并在用戶選擇該建議詞后基于該建議詞發(fā)起數(shù)據(jù)搜索的搜索模式;所述搜索時長表征從用戶開始輸入字符到得到搜索結(jié)果的時間差;
將所述搜索數(shù)據(jù)樣本中的輸入字符作為狀態(tài),在用戶輸入該輸入字符時為用戶推薦的搜索模式作為動作,生成狀態(tài)動作對,并將所述搜索時長作為與所述狀態(tài)動作對對應的回報,對預設(shè)的強化學習模型進行強化學習訓練,得到搜索決策模型;
響應于用戶輸入的搜索數(shù)據(jù),將用戶每次輸入的輸入字符輸入訓練完成的所述搜索模式?jīng)Q策模型進行推薦計算,并將當前的搜索模式切換為所述搜索模式?jīng)Q策模型輸出的搜索模式,以使用戶基于所述搜索模式?jīng)Q策模型輸出的搜索模式執(zhí)行搜索。
2.根據(jù)權(quán)利要求1所述的方法,所述在用戶的每次字符輸入時為用戶推薦的搜索模式,為在用戶的每次字符輸入時為用戶隨機推薦的搜索模式。
3.根據(jù)權(quán)利要求1所述的方法,所述強化學習模型的回報函數(shù)的回報衰減因子為動態(tài)值。
4.根據(jù)權(quán)利要求3所述的方法,所述強化學習模型的回報函數(shù)的回報衰減因子,為基于所述搜索數(shù)據(jù)中的所有字符輸入完成時的最大輸入次數(shù)確定出的動態(tài)值。
5.根據(jù)權(quán)利要求4所述的方法,所述強化學習模型為深度強化學習模型;其中,所述深度強化學習模型包括用于擬合回報函數(shù)的衰減因子的深度學習網(wǎng)絡(luò);
所述對預設(shè)的強化學習模型進行強化學習訓練,包括:
基于所述狀態(tài)動作對和所述搜索時長構(gòu)建訓練樣本,基于構(gòu)建的訓練樣本對預設(shè)的強化學習模型進行強化學習訓練,確定所述強化學習模型的回報函數(shù)中的模型參數(shù);以及,
確定所述搜索數(shù)據(jù)樣本中的最大字符輸入次數(shù),至少將所述最大字符輸入次數(shù)作為輸入數(shù)據(jù)輸入至所述深度學習網(wǎng)絡(luò)進行數(shù)據(jù)擬合,確定所述回報函數(shù)中的衰減因子。
6.根據(jù)權(quán)利要求5所述的方法,所述回報函數(shù)基于以下公式表征:
其中, 為j時刻對應狀態(tài)動作對的搜索時長; 為j+1時刻狀態(tài);表征該深度強化學習模型的模型參數(shù);a′表征j時刻狀態(tài)到j(luò)+1時刻狀態(tài)所對應選擇的動作,該動作為搜索模式,該搜索模式為直接搜索模式或者建議詞搜索模式;f為用于表征擬合替代回報函數(shù)的衰減因子的深度學習網(wǎng)絡(luò);index表征用戶輸入搜索數(shù)據(jù)過程中的第index次輸入,max_index表征用戶完成輸入搜索數(shù)據(jù)中的所有字符輸入時的最大輸入次數(shù)。
7.根據(jù)權(quán)利要求1所述的方法,還包括:
在用戶輸入的搜索數(shù)據(jù)前,將當前的搜索模式默認設(shè)置為建議詞搜索模式。
8.根據(jù)權(quán)利要求1所述的方法,所述響應于用戶輸入的搜索數(shù)據(jù),將用戶每次輸入的輸入字符輸入訓練完成的所述搜索模式?jīng)Q策模型進行推薦計算,并將當前的搜索模式切換為所述搜索模式?jīng)Q策模型輸出的搜索模式,以使用戶基于所述搜索模式?jīng)Q策模型輸出的搜索模式執(zhí)行搜索,包括:
響應于用戶輸入的搜索數(shù)據(jù),將用戶每次輸入的輸入字符輸入訓練完成的所述搜索模式?jīng)Q策模型進行推薦計算,在當前的搜索模式為建議詞搜索模式且所述搜索模式?jīng)Q策模型輸出的搜索模式為直接搜索模式時,將當前的搜索模式從建議詞搜索模式切換為直接搜索模式,以使用戶基于切換后的直接搜索模式直接獲得對應的搜索結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010329527.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





