[發(fā)明專利]網(wǎng)頁搜索方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201510945454.0 | 申請日: | 2015-12-15 |
| 公開(公告)號: | CN105447187B | 公開(公告)日: | 2017-09-22 |
| 發(fā)明(設計)人: | 代俊 | 申請(專利權(quán))人: | 廣州神馬移動信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務所(普通合伙)11371 | 代理人: | 吳開磊 |
| 地址: | 510627 廣東省廣州市天河區(qū)黃埔大*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網(wǎng)頁 搜索 方法 系統(tǒng) | ||
一.技術領域
本發(fā)明涉及搜索引擎優(yōu)化技術領域,尤其涉及一種網(wǎng)頁搜索方法及系統(tǒng)。
二.背景技術
隨著互聯(lián)網(wǎng)的發(fā)展及普及,越來越多的用戶通過各種終端設備中的瀏覽器進行網(wǎng)頁搜索,以獲取自己需要的信息。圖1示出了網(wǎng)頁搜索系統(tǒng)的架構(gòu)圖;該網(wǎng)頁搜索系統(tǒng)包括路由器(Router)101、緩存(Cache)系統(tǒng)102和檢索節(jié)點(Searcher)陣列103,其中,檢索節(jié)點(Searcher)陣列103中包含M行N列共M*N個檢索節(jié)點,路由器101始終維持與每個檢索節(jié)點的鏈接;實際應用中,由于網(wǎng)頁搜索任務量大,網(wǎng)頁搜索系統(tǒng)通常包含多個路由器及對應的檢索節(jié)點陣列。
上述網(wǎng)頁搜索系統(tǒng)的工作原理如下:當路由器101接收到客戶端發(fā)送的查詢詞時,在緩存系統(tǒng)102查詢是否有該查詢詞對應的搜索結(jié)果,如果有,則直接將該緩存的搜索結(jié)果返回至客戶端;如果緩存系統(tǒng)102沒有緩存該查詢詞對應的搜索結(jié)果,則在檢索節(jié)點陣列103的每一列中選定至少一個檢索節(jié)點(即共選定至少N個檢索節(jié)點)對所述查詢詞進行搜索,在得到所述檢索節(jié)點的搜索結(jié)果后,一方面將該搜索結(jié)果返回至客戶端,另一方面將該搜索結(jié)果及對應的查詢詞存儲于所述緩存系統(tǒng)中,以便在下次接收到相同的查詢詞時,直接從所述緩存系統(tǒng)中獲取對應的搜索結(jié)果。
基于上述工作原理,在路由器的流量(即在規(guī)定時間內(nèi)所要處理的搜索任務量)突增的情況下(例如,因光纜損壞、斷電等意外情況導致一個或幾個路由器停止工作,其他正常工作的路由器分擔停止工作的路由器的搜索任務,則使得正常工作的路由器流量突增),對應的搜索節(jié)點的搜索負載也會大幅增加,甚至超過其負載上限,無法及時響應如此高的搜索負載,導致搜索速度變慢,整個網(wǎng)頁搜索系統(tǒng)穩(wěn)定性降低甚至宕機。
三.發(fā)明內(nèi)容
為克服相關技術中存在的問題,本發(fā)明提供一種網(wǎng)頁搜索方法及系統(tǒng)。
本發(fā)明第一方面,提供一種網(wǎng)頁搜索方法,包括:
監(jiān)測網(wǎng)頁搜索系統(tǒng)的實時流量;
當所述實時流量在預設過載流量閾值和預設容災流量閾值之間,且,所述網(wǎng)頁搜索系統(tǒng)的緩存系統(tǒng)中不存在與目標查詢詞相同的預設查詢詞時,根據(jù)所述實時流量與正常流量的比值確定執(zhí)行本次搜索任務的檢索節(jié)點個數(shù)Q;其中,所述預設過載流量閾值小于所述預設容災流量閾值;
在所述網(wǎng)頁搜索系統(tǒng)的檢索節(jié)點陣列中選出Q個檢索節(jié)點,并觸發(fā)選出的Q個檢索節(jié)點執(zhí)行對所述目標查詢詞的實時搜索任務,得到實時搜索結(jié)果。
結(jié)合第一方面,在第一方面第一種可行的實施方式中,所述方法還包括:
將所述實時搜索結(jié)果存儲于相應檢索節(jié)點的緩存單元。
結(jié)合第一方面第一種可行的實施方式,在第一方面第二種可行的實施方式中,所述方法還包括:
將所述目標查詢詞及對應的檢索節(jié)點個數(shù)Q存儲于所述緩存系統(tǒng)中。
結(jié)合第一方面,或者第一方面第一種可行的實施方式,或者第一方面第二種可行的實施方式,在第一方面第三種可行的實施方式中,所述根據(jù)所述實時流量與正常流量的比值確定執(zhí)行本次搜索任務的檢索節(jié)點個數(shù)Q,包括:
根據(jù)公式計算本次搜索任務的檢索節(jié)點個數(shù)Q;
其中,Wnew表示所述實時流量,W表示所述網(wǎng)頁搜索系統(tǒng)可承受的正常流量,N表示所述檢索節(jié)點陣列的列數(shù)。
結(jié)合第一方面,或者第一方面第一種可行的實施方式,或者第一方面第二種可行的實施方式,在第一方面第四種可行的實施方式中,所述選擇所述網(wǎng)頁搜索系統(tǒng)的檢索節(jié)點陣列中的Q個檢索節(jié)點,包括:
通過滾動式選擇法選擇本次搜索任務所需的Q個檢索節(jié)點。
結(jié)合第一方面,在第一方面第五種可行的實施方式中,所述方法還包括:
在所述實時流量大于所述預設容災流量閾值時,根據(jù)所述實時流量與正常流量的比值確定執(zhí)行本次搜索任務的檢索節(jié)點個數(shù)Q,并在所述緩存系統(tǒng)中查找與目標查詢詞部分匹配的預設查詢詞;
選擇所述網(wǎng)頁搜索系統(tǒng)的檢索節(jié)點陣列中的Q個檢索節(jié)點,并觸發(fā)選中的Q個檢索節(jié)點執(zhí)行對所述目標查詢詞的實時搜索任務,得到實時搜索結(jié)果;
將所述實時搜索結(jié)果和所述預設查詢詞對應的預設搜索結(jié)果合并,得到所述目標查詢詞對應的目標搜索結(jié)果。
結(jié)合第一方面第五種可行的實施方式,在第一方面第六種可行的實施方式中,所述方法還包括:
根據(jù)所述緩存系統(tǒng)中存儲的每個預設查詢詞的哈希值及其分詞結(jié)果,在所述緩存系統(tǒng)中構(gòu)建各個分詞的倒排索引,得到各個分詞對應的哈希值倒排鏈;
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州神馬移動信息科技有限公司,未經(jīng)廣州神馬移動信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510945454.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





