[發(fā)明專利]一種搜索方法及裝置有效
| 申請?zhí)枺?/td> | 201710236272.5 | 申請日: | 2017-04-12 |
| 公開(公告)號: | CN106971000B | 公開(公告)日: | 2020-04-28 |
| 發(fā)明(設(shè)計)人: | 韓雷鈞 | 申請(專利權(quán))人: | 北京焦點新干線信息技術(shù)有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9538;G06F16/957 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100190 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 搜索 方法 裝置 | ||
本發(fā)明實施例中公開了一種搜索方法及裝置,接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;根據(jù)所述搜索詞進行搜索得到初始的搜索結(jié)果集;對所述搜索詞進行分詞處理;將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進行匹配,以確定所述搜索詞命中的詞庫類別作為目標詞庫類別;提高所述目標詞庫類別的權(quán)重數(shù)值;根據(jù)提高后的目標詞庫類別的權(quán)重數(shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集;將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。由于能夠按照用戶的搜索意圖,調(diào)整用戶的搜索詞對應(yīng)的權(quán)重數(shù)值,從而能夠?qū)⒏嫌脩粽鎸嵭枨蟮乃阉鹘Y(jié)果優(yōu)先展示給用戶。
技術(shù)領(lǐng)域
本發(fā)明涉及搜索技術(shù)領(lǐng)域,具體涉及一種搜索方法及裝置。
背景技術(shù)
垂直搜索引擎是針對某一特定領(lǐng)域、某一特定人群或某一特定需求的專業(yè)搜索引擎,是搜索引擎的細分和延伸,是對網(wǎng)頁庫中的某類專門的信息進行一次整合,定向分字段抽取出需要的數(shù)據(jù)進行處理后再以某種形式返回給用戶。
目前,垂直搜索引擎是通過用戶輸入的搜索關(guān)鍵詞,按照全文搜索匹配的規(guī)則計算相關(guān)文檔得分,然后按照得分由高到低的順序?qū)⑺阉鹘Y(jié)果依次輸出給用戶。但是,這種方法僅僅是按照系統(tǒng)認為的最優(yōu)排序?qū)⑺阉鹘Y(jié)果展示給用戶,完全沒有關(guān)心搜索結(jié)果排序是否符合用戶的真實需求。當搜索結(jié)果排序和用戶的真實需求有所差距時,將導(dǎo)致用戶真正想要的搜索結(jié)果沒有被優(yōu)先展示給用戶,從而影響了搜索轉(zhuǎn)化率和點擊率。比如,在房產(chǎn)領(lǐng)域,當用戶搜索諸如城市、區(qū)縣或者開發(fā)商名稱這些特定類別的詞匯時,垂直搜索引擎的搜索結(jié)果排序如果和用戶的真實需求有所差距時,一方面將導(dǎo)致用戶無法快速找到需要的房產(chǎn)信息,另一方面也影響了房產(chǎn)的出租或出售。
因此,如何將更符合用戶真實需求的搜索結(jié)果優(yōu)先展示給用戶成為本領(lǐng)域技術(shù)人員亟待解決的問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例提供一種搜索方法及裝置,能夠?qū)⒏嫌脩粽鎸嵭枨蟮乃阉鹘Y(jié)果優(yōu)先展示給用戶。
為實現(xiàn)上述目的,本發(fā)明實施例提供如下技術(shù)方案:
一種搜索方法,包括:
接收客戶端發(fā)送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;
根據(jù)所述搜索詞進行搜索得到初始的搜索結(jié)果集;
對所述搜索詞進行分詞處理;
將分詞處理所得的分詞在預(yù)設(shè)分類詞庫中進行匹配,以確定所述搜索詞命中的詞庫類別作為目標詞庫類別;
提高所述目標詞庫類別的權(quán)重數(shù)值;
根據(jù)提高后的目標詞庫類別的權(quán)重數(shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集;
將所述最終的搜索結(jié)果集返回給所述客戶端,以展示給所述用戶。
優(yōu)選的,所述根據(jù)提高后的目標詞庫類別的權(quán)重數(shù)值對所述初始的搜索結(jié)果集重新調(diào)整,生成最終的搜索結(jié)果集,包括:
根據(jù)提高后的目標詞庫類別的權(quán)重數(shù)值對所述初始的搜索結(jié)果集中的各個搜索結(jié)果進行打分;
按照分數(shù)由高至低的順序?qū)λ龀跏嫉乃阉鹘Y(jié)果集中的各個搜索結(jié)果進行排序,生成最終的搜索結(jié)果集。
優(yōu)選的,所述方法還包括:
獲取原始數(shù)據(jù)集;
采用詞庫分類器對所述原始數(shù)據(jù)集進行訓(xùn)練,生成預(yù)設(shè)分類詞庫。
優(yōu)選的,所述方法還包括:
獲取增量數(shù)據(jù)集;
采用詞庫分類器對所述增量數(shù)據(jù)集進行訓(xùn)練,更新所述預(yù)設(shè)分類詞庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京焦點新干線信息技術(shù)有限公司,未經(jīng)北京焦點新干線信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710236272.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





