[發明專利]搜索方法和裝置在審
| 申請號: | 201710032653.1 | 申請日: | 2017-01-16 |
| 公開(公告)號: | CN106874402A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 袁哲 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 董文倩,褚敏 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 方法 裝置 | ||
技術領域
本發明涉及信息處理領域,具體而言,涉及一種搜索方法和裝置。
背景技術
目前各大搜索引擎的實時索引系統,為了避免影響檢索的時效性,沒有進行結果緩存。在處理所有的檢索請求時,實時索引系統僅索引最近一段時間的數據,而非實時索引系統需要索引全量歷史數據。在檢索時,將實時索引系統的檢索結果與帶緩存的非實時索引系統的檢索結果融合后返回給搜索用戶。
整個系統流程如圖1所示,實時索引系統11基于關鍵詞在最近一段時間內的數據中進行檢索得到第一結果,非實時索引系統13基于關鍵詞在全量數據中進行檢索得到第二結果,將第二結果進行緩存,并將第一結果和第二結果進行融合,得到最終的檢索結果。
在上述方案中,為了保證檢索的時效性,放棄了結果緩存,在提升時新性效果的同時,也極大的增加了實時檢索系統的性能壓力。對于用戶量很大的檢索系統,無緩存機制的實時索引方案會導致大量的計算資源需求。同時,由于互聯網或者暗網的數據更新量在一定時間窗口范圍內是有限的,時間窗口越小,更新量越少,大量相關請求會造成大量的重復計算。例如,在A時刻搜索了QueryString1,需要完成1000篇相關文檔的計算,在A時刻之后新增了一篇與QueryString1相關的文檔,在間隔很短的B時刻某用戶又發起了搜索QueryString1的請求,則需要重新計算之前的1000篇相關文檔以及新增的一篇文檔,對于B時刻發起的搜索而言,絕大部分計算過程是重復的。
針對上述搜索效率低的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種搜索方法和裝置,以至少解決搜索效率低的技術問題。
根據本發明實施例的一個方面,提供了一種搜索方法,包括:在接收到搜索請求之后,獲取所述搜索請求的歷史搜索結果;根據所述歷史搜索結果檢測系統中是否存在增量數據,其中,所述增量數據用于表示新增數據中與所述查詢請求具有索引關系的數據,所述新增數據為在生成所述歷史搜索結果之后增加入所述系統中的數據;在檢測出存在所述增量數據的情況下,確定所述增量數據對應的增量搜索結果;至少基于所述增量搜索結果,確定所述搜索請求的搜索結果。
根據本發明實施例的另一方面,還提供了一種搜索裝置,包括:獲取單元,用于在接收到搜索請求之后,獲取所述搜索請求的歷史搜索結果;檢測單元,根據所述歷史搜索結果檢測系統中是否存在增量數據,其中,所述增量數據用于表示新增數據中與所述查詢請求具有索引關系的數據,所述新增數據為在生成所述歷史搜索結果之后增加入所述系統中的數據;第一確定單元,在檢測出存在所述增量數據的情況下,用于確定所述增量數據對應的增量搜索結果;第二確定單元,用于至少基于所述增量搜索結果,確定所述搜索請求的搜索結果。
在本發明實施例中,在接收到搜索請求之后,基于該搜索請求對應的歷史搜索結果檢測系統中是否存在增量數據,若檢測出存在增量數據,則在該增量數據中執行搜索操作,得到增量搜索結果,基于該增量搜索結果和歷史搜索結果,確定搜索請求的搜索結果,在該方案中無需在全量歷史數據中執行搜索操作,僅需在增量數據中執行搜索操作,節省了搜索操作的時間,進一步地,基于歷史搜索結果和增量搜索結果確定搜索請求的搜索結果,也可以保證搜索請求的準確性,解決了現有技術中搜索效率低的問題,提高了搜索效率。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
圖1是現有技術中的實時索引系統的搜索處理流程圖;
圖2是根據本發明實施例的搜索方法的硬件環境的示意圖;
圖3是根據本發明實施例的一種可選的搜索方法的流程圖;
圖4是根據本發明實施例的又一種可選的搜索方法的流程圖;
圖5是根據本發明實施例的另一種可選的搜索方法的流程圖;
圖6是根據本發明實施例的另一種可選的搜索方法的原理圖;
圖7是根據本發明實施例的另一種可選的搜索方法的語素與文檔標識的索引關系示意圖;
圖8是根據本發明實施例的再一種可選的搜索方法的流程圖;
圖9是根據本發明實施例的一種可選的搜索裝置的示意圖;
圖10是根據本發明實施例的一種可選的搜索裝置的示意圖;以及
圖11是根據本發明實施例的一種終端的結構框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710032653.1/2.html,轉載請聲明來源鉆瓜專利網。





