[發明專利]突發時效性查詢詞識別方法和系統在審
| 申請號: | 201410211458.1 | 申請日: | 2014-05-19 |
| 公開(公告)號: | CN103995865A | 公開(公告)日: | 2014-08-20 |
| 發明(設計)人: | 蘇文杰;常富洋;秦吉勝;周鴻祎 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京鼎佳達知識產權代理事務所(普通合伙) 11348 | 代理人: | 王偉鋒;劉鐵生 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 突發 時效性 查詢 識別 方法 系統 | ||
技術領域
本發明涉及計算機技術領域,具體而言,涉及一種突發時效性查詢詞識別方法和系統。
背景技術
突發時效性查詢詞是短時間內用戶對其的查詢量較之前明顯變大的查詢詞,所以突發時效性查詢詞往往反映的是一個新的事件的爆發,引發用戶對事件的關注,其具有很強的時效性。因此,及時識別出突發時效性查詢詞,并根據突發時效性查詢詞來調整搜索引擎中新聞的排名,可以有效提升用戶對新聞的搜索體驗,改善搜索引擎的質量。
現有的識別突發時效性查詢詞的方法,是根據查詢詞在當前時間段的查詢量和在前一段時間的查詢量比較,差值越大越說明該查詢詞可能是當前時間段的突發時效性查詢詞。
上述技術方案的缺點在于,如兩段時間內查詢詞的查詢量維持較小的量級,則可能造成查詢詞的查詢量出現了突增但差值卻較小的情況,而差值過小則造成無法識別出該突發時效性查詢詞,例如:
1、一些查詢量大的查詢詞的查詢量改變會掩蓋突發時效性查詢詞,比如,查詢詞A的查詢量由10000變為11000,那么差值就為1000,而突發時效性查詢詞的查詢量由100變為200,查詢量雖然翻倍但差值僅為100,與查詢詞A差值相比較小,無法體現出查詢量的突增變化,造成難以識別出該突發時效性查詢詞。
2、一般地,統計查詢量的時間段設置的比較小(如按小時設置),由于查詢詞的查詢量受時間影響較大,在凌晨時段的整體查詢量較小,在凌晨比較查詢量得到的差值也較小,所以難以識別出突發時效性查詢詞;如為了克服該問題,將時間段設置的比較大(如按天設置),進行不同時間段的查詢量比較的時間間隔就比較久,那么突發時效性查詢詞會更新比較慢。
所以,本發明需要解決的技術問題在于,提供一種新的識別突發時效性查詢詞的技術方案,保證即使在查詢詞的查詢量始終維持在較小量級的情況下,也能有效地識別出突發時效性查詢詞。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的突發時效性查詢詞識別方法和系統。
依據本發明的一個方面,提供了一種突發時效性查詢詞識別方法,其包括:分別計算查詢詞在第一段時間內和第二段時間內的查詢量變化趨勢,所述第二段時間為所述第一段時間的一部分;比較所述查詢詞在所述第一段時間和所述第二段時間內的查詢量變化趨勢之間的差距,并根據所述差距的大小判斷所述查詢詞是否為突發時效性查詢詞。
可選地,前述的突發時效性查詢詞識別方法,所述分別計算查詢詞在第一段時間內和第二段時間內的查詢量變化趨勢的步驟包括:按預設長度的時間段,連續多次統計所述查詢詞的查詢量;取最近的連續m個時間段為所述第一段時間,并根據所述查詢詞在所述m個時間段內的查詢量,確定所述查詢詞在所述第一段時間內的查詢量變化趨勢,m為整數;取最近的連續n個時間段為所述第二段時間,并根據所述查詢詞在所述n個時間段內的查詢量,確定所述查詢詞在所述第二段時間內的查詢量變化趨勢,n為小于m的整數。
可選地,前述的突發時效性查詢詞識別方法,所述比較所述查詢詞在所述第一段時間和所述第二段時間內的查詢量變化趨勢之間的差距的步驟包括:取反映所述查詢詞在所述第一段時間內的查詢量變化趨勢的第一軌跡線,以及反映所述查詢詞在所述第二段時間內的查詢量變化趨勢的第二軌跡線,并將所述第一軌跡線以及所述第二軌跡線的夾角作為所述差距。
可選地,前述的突發時效性查詢詞識別方法,還包括:獲取所述查詢詞對應的多個搜索結果條目,所述多個搜索結果條目中包含新聞信息條目;為所述多個搜索結果條目分別設置權值;在所述查詢詞為突發時效性查詢詞時,增大所述新聞信息條目的權值;根據所述多個搜索結果條目的權值大小,在所述查詢詞對應的搜索結果頁上,確定所述多個搜索結果條目的排名位置。
依據本發明的另一方面,提供了一種突發時效性查詢詞識別系統,其包括:變化趨勢計算模塊,用于分別計算查詢詞在第一段時間內和第二段時間內的查詢量變化趨勢,所述第二段時間為所述第一段時間的一部分;識別模塊,用于比較所述查詢詞在所述第一段時間和所述第二段時間內的查詢量變化趨勢之間的差距,并根據所述差距的大小判斷所述查詢詞是否為突發時效性查詢詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410211458.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:工業電弧爐余熱利用及煙氣回收裝置
- 下一篇:一種細菌培養皿用加熱風干清理裝置





