[發明專利]一種搜索方法及裝置有效
| 申請號: | 201710236272.5 | 申請日: | 2017-04-12 |
| 公開(公告)號: | CN106971000B | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 韓雷鈞 | 申請(專利權)人: | 北京焦點新干線信息技術有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9538;G06F16/957 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100190 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 搜索 方法 裝置 | ||
1.一種搜索方法,其特征在于,包括:
接收客戶端發送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;
根據所述搜索詞進行搜索得到初始的搜索結果集;
對所述搜索詞進行分詞處理;
將分詞處理所得的分詞在預設分類詞庫中進行匹配,以確定所述搜索詞命中的詞庫類別作為目標詞庫類別;
將所述目標詞庫類別的權重數值更改為預設的最高權重的詞庫類別的權重數值,預設的最高權重的詞庫類別的權重數值更改為預設的次高權重的詞庫類別的權重數值;
根據提高后的目標詞庫類別的權重數值對所述初始的搜索結果集重新調整,生成最終的搜索結果集;
將所述最終的搜索結果集返回給所述客戶端,以展示給所述用戶;
所述根據提高后的目標詞庫類別的權重數值對所述初始的搜索結果集重新調整,生成最終的搜索結果集,包括:
根據提高后的目標詞庫類別的權重數值對所述初始的搜索結果集中的各個搜索結果進行打分;
按照分數由高至低的順序對所述初始的搜索結果集中的各個搜索結果進行排序,生成最終的搜索結果集;
獲取原始數據集;采用詞庫分類器對所述原始數據集進行訓練,生成預設分類詞庫;
獲取增量數據集;采用詞庫分類器對所述增量數據集進行訓練,更新所述預設分類詞庫。
2.根據權利要求1所述的搜索方法,其特征在于,所述采用詞庫分類器對所述增量數據集進行訓練,更新所述預設分類詞庫,包括:
采用詞庫分類器從所述增量數據集中提取詞庫類別信息;
將所述詞庫類別信息添加至所述預設分類詞庫中。
3.一種搜索裝置,其特征在于,包括:
接收單元,用于接收客戶端發送的搜索請求,所述搜索請求中包括用戶通過所述客戶端輸入的搜索詞;
搜索單元,用于根據所述搜索詞進行搜索得到初始的搜索結果集;
分詞單元,用于對所述搜索詞進行分詞處理;
匹配單元,用于將分詞處理所得的分詞在預設分類詞庫中進行匹配,以確定所述搜索詞命中的詞庫類別作為目標詞庫類別;
權重調整單元,用于將所述目標詞庫類別的權重數值更改為預設的最高權重的詞庫類別的權重數值,預設的最高權重的詞庫類別的權重數值更改為預設的次高權重的詞庫類別的權重數值;
搜索結果集調整單元,用于根據提高后的目標詞庫類別的權重數值對所述初始的搜索結果集重新調整,生成最終的搜索結果集;
返回單元,用于將所述最終的搜索結果集返回給所述客戶端,以展示給所述用戶;
所述搜索結果集調整單元具體包括:
打分子單元,用于根據提高后的目標詞庫類別的權重數值對所述初始的搜索結果集中的各個搜索結果進行打分;
排序子單元,用于按照分數由高至低的順序對所述初始的搜索結果集中的各個搜索結果進行排序,生成最終的搜索結果集;
所述裝置還包括:
獲取單元,用于獲取原始數據集;
訓練單元,用于采用詞庫分類器對所述原始數據集進行訓練,生成預設分類詞庫;
所述獲取單元還用于:
獲取增量數據集;
所述訓練單元,還用于采用詞庫分類器對所述增量數據集進行訓練,更新所述預設分類詞庫。
4.根據權利要求3所述的搜索裝置,其特征在于,所述訓練單元具體用于:
采用詞庫分類器從所述增量數據集中提取詞庫類別信息;
將所述詞庫類別信息添加至所述預設分類詞庫中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京焦點新干線信息技術有限公司,未經北京焦點新干線信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710236272.5/1.html,轉載請聲明來源鉆瓜專利網。





