[發明專利]基于關鍵詞的事件演化過程的分析方法及系統有效
| 申請號: | 201510062379.3 | 申請日: | 2015-02-05 |
| 公開(公告)號: | CN104778202B | 公開(公告)日: | 2018-08-14 |
| 發明(設計)人: | 張日崇;盧忠宇;于偉仁;胡春明 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 馬爽;黃健 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 關鍵詞 事件 演化 過程 分析 方法 系統 | ||
本發明實施例提供一種基于關鍵詞的事件演化過程的分析方法及系統。該方法包括:統計各時間段內的搜索結果數量,獲得搜索結果數量隨時間段變化的序列;對所述序列進行尖峰檢測獲得至少一個尖峰窗口;對尖峰窗口對應的搜索結果進行文本分析,獲得尖峰描述;顯示搜索結果數量隨時間段變化的序列,并在尖峰的位置顯示尖峰描述。本發明實施例通過統計搜索結果數量隨時間段變化的序列,顯示搜索結果數量隨時間段變化的序列以及尖峰描述,展現出微博信息數量隨時間變化的趨勢,微博信息數量隨時間變化的趨勢能夠展現出與關鍵詞相關的事件的演化過程,依據尖峰描述用戶不必詳細閱讀微博內容便可獲知微博信息的主要內容,提高了搜索結果顯示的信息量。
技術領域
本發明實施例涉及計算機技術領域,尤其涉及一種基于關鍵詞的事件演化過程的分析方法及系統。
背景技術
隨著計算機技術的發展,微博軟件作為信息獲取的一個重要來源已經成為廣泛應用的社交類軟件。
現有技術中,微博軟件通過用戶輸入的關鍵字進行匹配搜索,并將搜索出的與該關鍵字密切相關的微博信息顯示在用戶終端。
由于微博信息具有時間屬性,但現有的微博信息顯示結果無法展現微博信息隨時間變化的趨勢,導致搜索結果顯示的信息量較低,并且無法展現與關鍵詞相關的事件的演化過程。
發明內容
本發明實施例提供一種基于關鍵詞的事件演化過程的分析方法及系統,以提高搜索結果顯示的信息量,并展現與關鍵詞相關的事件的演化過程。
本發明實施例的一個方面是提供一種基于關鍵詞的事件演化過程的分析方法,包括:
統計各時間段內的搜索結果數量,獲得所述搜索結果數量隨所述時間段變化的序列;
對所述序列進行尖峰檢測獲得至少一個尖峰窗口,每個所述尖峰窗口包括一個子序列,所述子序列包括一個尖峰,所述尖峰是所述搜索結果數量在所述序列中的局部最大值;
對所述尖峰窗口對應的搜索結果進行文本分析,獲得尖峰描述;
顯示所述搜索結果數量隨所述時間段變化的序列,并在所述尖峰的位置顯示所述尖峰描述。
本發明實施例的另一個方面是提供一種基于關鍵詞的事件演化過程的分析系統,包括:
統計模塊,用于統計各時間段內的搜索結果數量,獲得所述搜索結果數量隨所述時間段變化的序列;
檢測模塊,用于對所述序列進行尖峰檢測獲得至少一個尖峰窗口,每個所述尖峰窗口包括一個子序列,所述子序列包括一個尖峰,所述尖峰是所述搜索結果數量在所述序列中的局部最大值;
文本分析模塊,用于對所述尖峰窗口對應的搜索結果進行文本分析,獲得尖峰描述;
顯示模塊,用于顯示所述搜索結果數量隨所述時間段變化的序列,并在所述尖峰的位置顯示所述尖峰描述。
本發明實施例提供的基于關鍵詞的事件演化過程的分析方法及系統,通過統計搜索結果數量隨時間段變化的序列,依據尖峰檢測獲取該序列的局部最大值,分析該局部最大值出現的原因獲得尖峰描述,顯示搜索結果數量隨時間段變化的序列,并在尖峰位置顯示尖峰描述,實現了微博信息顯示結果能夠展現微博信息數量隨時間變化的趨勢,微博信息數量隨時間變化的趨勢能夠展現出與關鍵詞相關的事件的演化過程,依據尖峰描述用戶不必詳細閱讀微博內容便可獲知微博信息的主要內容,提高了搜索結果顯示的信息量。
附圖說明
圖1為本發明實施例提供的基于關鍵詞的事件演化過程的分析方法流程圖;
圖2為本發明另一實施例提供的尖峰窗口的示意圖;
圖3為本發明另一實施例提供的尖峰窗口的示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510062379.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于兩層聚類的多文檔主題發現方法
- 下一篇:一種數據查找方法及裝置





