[發明專利]進行數據搜索的方法及搜索服務器有效
| 申請號: | 201310370878.X | 申請日: | 2013-08-23 |
| 公開(公告)號: | CN104424215B | 公開(公告)日: | 2018-02-27 |
| 發明(設計)人: | 王頊;唐文寧;禹榮凌;岑植旺 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司11018 | 代理人: | 周華霞,王麗琴 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 進行 數據 搜索 方法 服務器 | ||
技術領域
本發明涉及數據處理技術,尤其涉及進行數據搜索的方法及搜索服務器。
背景技術
現有技術中,進行數據搜索時,用戶在搜索網頁的查詢欄中輸入查詢詞,向搜索服務器發送包含查詢詞的查詢請求,接收搜索服務器反饋關于查詢詞的搜索條目;之后,用戶可點擊搜索條目,以切換到該搜索條目對應的網頁查詢詳細內容。
在用戶輸入查詢詞的過程中,搜索服務器會根據用戶輸入的過程信息反饋聯想詞,以顯示在網頁的智能提示欄中;用戶可直接點擊聯想詞,以作為查詢詞,發送給搜索服務器。并且,在顯示搜索條目時,網頁在相關搜索欄還會顯示與查詢詞關聯的相關搜索詞,一般地,相關搜索欄置于網頁下端。
舉例進行說明,想要輸入的查詢詞為ABC,當輸入到AB時,即過程信息為AB,聯想詞里包括ABC、阿波羅、ABB等,這時可以直接選中ABC;進行查詢之后,相關搜索欄中顯示的相關搜索詞包括智能ABC輸入法、ABC兒歌等。
用戶的搜索行為記錄在搜索日志中,搜索服務器對搜索日志進行分析,來確定各查詢詞的聯想詞和相關搜索詞。分析方法有多種,舉例說明:對于查詢詞ABC,如果搜索日志中記錄的以“ABC公司最好”為查詢詞進行查詢的次數大于設定閾值,則將“ABC公司最好”作為ABC的聯想詞和相關搜索詞,分別放入聯想詞庫和相關搜索詞庫中。這里,將聯想詞和相關搜索詞統稱為提示詞。
在實際運用中,存在采用機器操作頻繁輸入查詢詞,以增加某查詢詞的搜索次數,進而將其設置到聯想詞庫和相關搜索詞庫中,以提高該查詢詞為用戶點擊的幾率。這導致搜索時顯示提示詞的準確性較低。
目前,機器操作一般具有搜索頻率較高的特點,例如為1分鐘10次查詢,因而,為了避免機器操作,常采用如下的解決方式:對用戶關于某查詢詞的搜索頻率進行判斷,如果大于設定閾值,例如大于1分鐘5次,則判斷為機器操作,對其進行標記,不將其作為提示詞。但該方式存在以下缺陷:如果機器操作時將搜索頻率降低,例如為1分鐘1次,則無法對其進行避免,仍為將其確定為提示詞,導致搜索時顯示提示詞的準確性很低。
發明內容
本發明提供了一種進行數據搜索的方法,該方法能夠提高數據搜索時顯示提示詞的準確性。
本發明提供了一種進行數據搜索的搜索服務器,該搜索服務器提高數據搜索時顯示提示詞的準確性。
一種進行數據搜索的方法,該方法包括:
從搜索日志中提取出設定時間段內的搜索記錄;
從搜索記錄中統計出對應查詢詞的特征參數,所述特征參數包括查詢詞被查詢的總次數Qv和查詢詞對應的查詢前驅行為為空的查詢次數NoReferQv;
由查詢詞的特征參數確定查詢詞是否為異常查詢詞;
對異常查詢詞進行標記,以使異常查詢詞不用于后續的搜索處理。
一種進行數據搜索的搜索服務器,該搜索服務器包括搜索記錄提取單元、特征參數統計單元、異常查詢詞確定單元和標記單元;
所述搜索記錄提取單元,從搜索日志中提取出設定時間段內的搜索記錄,發送給所述特征參數統計單元;
所述特征參數統計單元,從搜索記錄中統計出對應查詢詞的特征參數,發送給所述異常查詢詞確定單元,所述特征參數包括查詢詞被查詢的總次數Qv和查詢詞對應的查詢前驅行為為空的查詢次數NoReferQv;
所述異常查詢詞確定單元,由查詢詞的特征參數確定查詢詞是否為異常查詢詞;
所述標記單元,對異常查詢詞進行標記,以使異常查詢詞不用于后續的搜索處理。
從上述方案可以看出,本發明中,從搜索日志中提取出設定時間段內的搜索記錄;對提取出的搜索記錄進行分析,從搜索記錄中統計出對應查詢詞的特征參數,所述特征參數包括查詢詞被查詢的總次數Qv,查詢詞對應的查詢前驅行為為空的查詢次數NoReferQv;根據Qv、NoReferQv進行判斷,確定出異常查詢詞;對異常查詢詞進行標記,以使聯想詞庫和相關搜索詞庫中的異常查詢詞不用于后續的搜索處理。本發明基于查詢詞被查詢的總次數Qv,查詢詞對應的查詢前驅行為為空的查詢次數NoReferQv,進行異常查詢詞的判斷,而不采用基于搜索頻率來確定異常查詢詞,這樣,對于機器操作搜索頻率較低的情況,可避免將其確定為提示詞,從而,提高了數據搜索時顯示提示詞的準確性。
附圖說明
圖1為本發明進行數據搜索的方法示意性流程圖;
圖2為本發明進行數據搜索的方法流程圖實例;
圖3為本發明進行數據搜索的系統結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310370878.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種治療心腦血管硬化的藥方
- 下一篇:用于LED燈的散熱器及具有其的燈具
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





