[發明專利]一種識別微博突發熱點事件的方法及裝置在審
| 申請號: | 201310452806.X | 申請日: | 2013-09-27 |
| 公開(公告)號: | CN103455639A | 公開(公告)日: | 2013-12-18 |
| 發明(設計)人: | 崔安頎;張敏;劉奕群;馬少平;金奕江 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100084 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 突發 熱點 事件 方法 裝置 | ||
1.一種識別微博突發熱點事件的方法,其特征在于,包括:
提取所有熱點事件的微博話題標簽,并記錄每個話題標簽的發布時間、作者信息以及熱門程度;其中,所述熱門程度是指在不同時間段內的出現次數;
對于所述每個話題標簽,計算所述每個話題標簽的三個度量值;其中,三個度量值分別為不穩定性程度、在線話題可能性程度和標簽作者信息熵;
根據所述三個度量值的高低判斷相應的熱點事件是否為突發事件。
2.根據權利要求1所述的方法,其特征在于,根據所述三個度量值的高低判斷相應的熱點事件是否為突發事件包括:
判斷所述不穩定性程度是否大于第一閾值、在線話題可能性程度是否小于第二閾值以及標簽作者信息熵是否大于第三閾值;
若是,則判定所述相應的熱點事件為突發事件;
若否,則判定所述相應的熱點事件為非突發事件。
3.根據權利要求1所述的方法,其特征在于,所述不穩定性程度通過以下公式計算:
其中,n是用于歸一化的天數,即語料覆蓋的時間段;是指不穩定點x的出現概率;p是指事先指定的容忍概率;Inst(x)是指不穩定點x的不穩定性程度,由下式定義:
其中,ε>0,是一個小實數,用于消除零錯誤。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310452806.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多媒體文件檢索的方法和裝置
- 下一篇:一種數據查詢方法和裝置





