[發(fā)明專利]查詢推薦方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)在審
| 申請?zhí)枺?/td> | 202110420976.4 | 申請日: | 2021-04-19 |
| 公開(公告)號(hào): | CN113342862A | 公開(公告)日: | 2021-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 張學(xué)濤 | 申請(專利權(quán))人: | 北京房江湖科技有限公司 |
| 主分類號(hào): | G06F16/2457 | 分類號(hào): | G06F16/2457;G06N20/00 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 楊云云 |
| 地址: | 101309 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 查詢 推薦 方法 裝置 電子設(shè)備 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提供一種查詢推薦方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì),其中所述方法包括:獲取用戶輸入的查詢請求,并基于查詢請求,獲取用戶物料的基礎(chǔ)特征;利用預(yù)設(shè)特征處理配置和預(yù)設(shè)特征處理算子,對基礎(chǔ)特征進(jìn)行特征處理,獲取目標(biāo)特征;基于目標(biāo)特征,利用查詢推薦模型,輸出匹配的查詢推薦結(jié)果;其中,查詢推薦模型為利用訓(xùn)練樣本特征進(jìn)行離線訓(xùn)練獲取,訓(xùn)練樣本特征為利用預(yù)設(shè)特征處理配置和預(yù)設(shè)特征處理算子對離線環(huán)境下的用戶物料樣本特征進(jìn)行特征處理獲取。本發(fā)明通過設(shè)定離線環(huán)境和生產(chǎn)環(huán)境可以共用的特征處理配置和特征處理算子,可保證線上、線下配置和處理算子的一致性,從而能夠有效簡化開發(fā)流程,提高開發(fā)效率并降低維護(hù)成本。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,尤其涉及一種查詢推薦方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
在使用基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)模型進(jìn)行搜索排序或推薦排序時(shí),需要用到用戶以及物料的相關(guān)特征。由于不同特征的數(shù)值所代表的含義和數(shù)值范圍通常會(huì)不一致,因此需要通過特征處理將不同特征歸一化至同一尺度范圍內(nèi),以方便利用機(jī)器模型進(jìn)行處理。
目前,在開發(fā)相關(guān)機(jī)器模型時(shí),通常在離線環(huán)境下進(jìn)行。如圖1所示,為根據(jù)現(xiàn)有技術(shù)的查詢推薦方法的流程示意圖,其中采用離線方式獲取目標(biāo)模型。離線過程一般采用基于Python的特征處理方法,也即使用PySpark,按照預(yù)先定義的特征處理配置進(jìn)行特征處理,得到訓(xùn)練數(shù)據(jù),然后利用這些訓(xùn)練數(shù)據(jù)訓(xùn)練得到理想的模型,將該模型發(fā)布至生產(chǎn)環(huán)境。之后,生產(chǎn)環(huán)境需要按照定義好的特征處理配置,使用基于Java的特征處理方法,對生產(chǎn)過程實(shí)際的用戶物料基礎(chǔ)特征進(jìn)行特征處理,得到特征處理結(jié)果,并基于此進(jìn)行生成實(shí)際預(yù)測。
發(fā)明內(nèi)容
本發(fā)明提供一種查詢推薦方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì),用以解決現(xiàn)有技術(shù)開發(fā)流程復(fù)雜,效率低,且易出現(xiàn)錯(cuò)誤,維護(hù)成本較高的缺陷,實(shí)現(xiàn)簡化開發(fā)流程,提高開發(fā)效率并降低維護(hù)成本的目標(biāo)。
本發(fā)明提供一種查詢推薦方法,包括:
獲取用戶輸入的查詢請求,并基于所述查詢請求,獲取用戶物料的基礎(chǔ)特征;
利用預(yù)設(shè)特征處理配置和預(yù)設(shè)特征處理算子,對所述基礎(chǔ)特征進(jìn)行特征處理,獲取目標(biāo)特征;
基于所述目標(biāo)特征,利用查詢推薦模型,輸出匹配的查詢推薦結(jié)果;
其中,所述查詢推薦模型為利用訓(xùn)練樣本特征進(jìn)行離線訓(xùn)練獲取,所述訓(xùn)練樣本特征為利用所述預(yù)設(shè)特征處理配置和所述預(yù)設(shè)特征處理算子,對離線環(huán)境下的用戶物料樣本特征進(jìn)行特征處理獲取。
根據(jù)本發(fā)明一個(gè)實(shí)施例的查詢推薦方法,在所述利用查詢推薦模型,輸出匹配的查詢推薦結(jié)果之前,還包括:
離線獲取預(yù)定數(shù)量的歷史查詢請求,并基于所述歷史查詢請求,獲取所述用戶物料樣本特征;
利用所述預(yù)設(shè)特征處理配置和所述預(yù)設(shè)特征處理算子,對所述用戶物料樣本特征進(jìn)行特征處理,獲取所述訓(xùn)練樣本特征;
基于用戶設(shè)定的查詢需求,搭建初始查詢推薦模型,并利用所述訓(xùn)練樣本特征,訓(xùn)練所述初始查詢推薦模型,獲取所述查詢推薦模型。
根據(jù)本發(fā)明一個(gè)實(shí)施例的查詢推薦方法,在所述利用預(yù)設(shè)特征處理配置和預(yù)設(shè)特征處理算子,對所述基礎(chǔ)特征進(jìn)行特征處理之前,還包括:
獲取文件格式標(biāo)準(zhǔn),并基于所述文件格式標(biāo)準(zhǔn),生成特征處理配置文件,且獲取所述預(yù)設(shè)特征處理配置。
根據(jù)本發(fā)明一個(gè)實(shí)施例的查詢推薦方法,所述設(shè)定文件格式標(biāo)準(zhǔn),包括:
設(shè)定所述文件格式標(biāo)準(zhǔn)如下:
process_handler:featureHandler
feature_name:feature_name_a,feature_name_b
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京房江湖科技有限公司,未經(jīng)北京房江湖科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110420976.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 帶有前處理和后處理的數(shù)據(jù)庫復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語言的查詢方法及查詢系統(tǒng)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





