[發(fā)明專利]一種搜索推薦系統(tǒng)及方法在審
| 申請(qǐng)?zhí)枺?/td> | 202111542121.5 | 申請(qǐng)日: | 2021-12-16 |
| 公開(kāi)(公告)號(hào): | CN114417115A | 公開(kāi)(公告)日: | 2022-04-29 |
| 發(fā)明(設(shè)計(jì))人: | 李宇圣 | 申請(qǐng)(專利權(quán))人: | 航天信息股份有限公司 |
| 主分類號(hào): | G06F16/9532 | 分類號(hào): | G06F16/9532;G06F16/9537;G06F16/9538;G06F16/951 |
| 代理公司: | 北京工信聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 11266 | 代理人: | 賈銀秋 |
| 地址: | 100195 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 搜索 推薦 系統(tǒng) 方法 | ||
本發(fā)明公開(kāi)了一種搜索推薦系統(tǒng)及方法,屬于搜索推薦算法技術(shù)領(lǐng)域。本發(fā)明系統(tǒng),包括:索引模塊,所述索引模塊采用Elasticsearch作為存儲(chǔ)介質(zhì),設(shè)置Elasticsearch字段的映射模板;所述索引模塊對(duì)用戶獲取的匹配詞進(jìn)行索引;數(shù)據(jù)遷移模塊,所述數(shù)據(jù)遷移模塊對(duì)原始數(shù)據(jù)進(jìn)行導(dǎo)入,并對(duì)導(dǎo)入的數(shù)據(jù)進(jìn)行清洗,將所述清洗后的數(shù)據(jù)由所述Elasticsearch字段的映射模板映射至Elasticsearch的索引中;搜索模塊,所述搜索模塊接收用戶的搜索的關(guān)鍵詞,將所述關(guān)鍵詞推送至搜索推薦模塊;搜索推薦模塊,所述搜索推薦模塊內(nèi)置搜索推薦算法,通過(guò)所述搜索推薦算法對(duì)用戶輸入的關(guān)鍵詞進(jìn)行分詞及過(guò)濾,獲取匹配詞。本發(fā)明采用Elasticsearch作為存儲(chǔ)介質(zhì),極大的提高了系統(tǒng)的響應(yīng)。
技術(shù)領(lǐng)域
本發(fā)明涉及搜索推薦算法技術(shù)領(lǐng)域,并且更具體地,涉及一種搜索推薦系統(tǒng)及方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展更新,數(shù)據(jù)量越來(lái)越大,用戶對(duì)系統(tǒng)快速響應(yīng)及智能化的需求與日俱增。一般地,在網(wǎng)站顯眼的位置會(huì)有搜索框,用戶輸入關(guān)鍵詞后會(huì)在下方進(jìn)行搜索關(guān)鍵詞推薦,用戶可以在推薦的此條中選擇符合自己需求的推薦詞條進(jìn)行搜索。但是在大數(shù)據(jù)時(shí)代,響應(yīng)速度和準(zhǔn)確性成為了更緊迫的需求。面對(duì)不同用戶群,如果系統(tǒng)響應(yīng)時(shí)間長(zhǎng),不能及時(shí)收到推薦;或者搜索時(shí)由于用戶輸入不準(zhǔn)確、或者推薦算法參數(shù)維度少而造成推薦不符合用戶需求,就必須通過(guò)多次嘗試,或者必須準(zhǔn)確輸入搜索詞來(lái)進(jìn)行更好的搜索匹配,極大影響了用戶體驗(yàn)。
發(fā)明內(nèi)容
針對(duì)上述問(wèn)題,本發(fā)明提出了一種搜索推薦系統(tǒng),包括:
索引模塊,所述索引模塊采用Elasticsearch作為存儲(chǔ)介質(zhì),設(shè)置Elasticsearch字段的映射模板;所述索引模塊對(duì)用戶獲取的匹配詞進(jìn)行索引;
數(shù)據(jù)遷移模塊,所述數(shù)據(jù)遷移模塊對(duì)原始數(shù)據(jù)進(jìn)行導(dǎo)入,并對(duì)導(dǎo)入的數(shù)據(jù)進(jìn)行清洗,將所述清洗后的數(shù)據(jù)由所述Elasticsearch字段的映射模板映射至Elasticsearch的索引中;
搜索模塊,所述搜索模塊接收用戶的搜索的關(guān)鍵詞,將所述關(guān)鍵詞推送至搜索推薦模塊;
搜索推薦模塊,所述搜索推薦模塊內(nèi)置搜索推薦算法,通過(guò)所述搜索推薦算法對(duì)用戶輸入的關(guān)鍵詞進(jìn)行分詞及過(guò)濾,獲取匹配詞。
可選的,索引模塊對(duì)用戶獲取的匹配詞進(jìn)行索引,采用jieba和pinyin分詞相結(jié)合的形式,搜索字段使用jieba進(jìn)行語(yǔ)義分詞并進(jìn)行前綴、全拼和模糊過(guò)濾。
可選的,原始數(shù)據(jù)的導(dǎo)入包括全量導(dǎo)入以及增量導(dǎo)入。
可選的,搜索推薦算法為多維數(shù)據(jù)加權(quán)分排序算法。
可選的,搜索模塊,包括前端頁(yè)面以及后臺(tái)程序,所述前端頁(yè)面用于獲取用戶輸入的關(guān)鍵詞,所述后臺(tái)程序用于將所述關(guān)鍵詞傳輸至搜索推薦模塊。
本發(fā)明還提出了一種搜索推薦方法,包括:
設(shè)置存儲(chǔ)介質(zhì)Elasticsearch字段的映射模板;
通過(guò)數(shù)據(jù)遷移模塊對(duì)原始數(shù)據(jù)進(jìn)行導(dǎo)入,并對(duì)導(dǎo)入的數(shù)據(jù)進(jìn)行清洗,將所述清洗后的數(shù)據(jù)由所述Elasticsearch字段的映射模板映射至Elasticsearch的索引中;
通過(guò)搜索模塊接收用戶的搜索的關(guān)鍵詞,將所述關(guān)鍵詞推送至搜索推薦模塊;
通過(guò)搜索推薦模塊內(nèi)置搜索推薦算法,通過(guò)所述搜索推薦算法對(duì)用戶輸入的關(guān)鍵詞進(jìn)行分詞及過(guò)濾,獲取匹配詞;通過(guò)索引模塊對(duì)用戶獲取的匹配詞進(jìn)行索引。
可選的,索引模塊對(duì)用戶獲取的匹配詞進(jìn)行索引,采用jieba和pinyin分詞相結(jié)合的形式,搜索字段使用jieba進(jìn)行語(yǔ)義分詞并進(jìn)行前綴、全拼和模糊過(guò)濾。
可選的,原始數(shù)據(jù)的導(dǎo)入包括全量導(dǎo)入以及增量導(dǎo)入。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于航天信息股份有限公司,未經(jīng)航天信息股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111542121.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





