[發明專利]一種微博網絡地域突發事件的檢測方法有效
| 申請號: | 201710455550.6 | 申請日: | 2017-06-15 |
| 公開(公告)號: | CN107273496B | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 仲兆滿;管燕;李存華 | 申請(專利權)人: | 淮海工學院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/9536;G06F40/289;G06Q50/00 |
| 代理公司: | 連云港潤知專利代理事務所 32255 | 代理人: | 劉喜蓮 |
| 地址: | 222000 江蘇省連云港市海*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 地域 突發事件 檢測 方法 | ||
本發明公開了一種微博網絡地域突發事件的檢測方法,其步驟如下:(1)從微博網絡中采集地域微博,得到微博集合PLMB,對微博預處理后得到微博集合LMB;(2)從微博集合LMB中提取突發詞,得到突發詞集合EW;(3)對EW中的突發詞進行聚類,得到突發事件詞簇EWC={ewc1,ewc2,…,ewcq},假設有q個詞簇。本發明方法提出了利用詞頻率、詞關聯用戶、詞分布地域及詞社交行為4類指標,計算詞的突發值,更合理的利用了微博網絡詞的突發特征,更適合微博網絡地域突發事件的檢測。
技術領域
本發明涉及一種信息挖掘技術,具體地說,涉及一種微博網絡地域突發事件檢測方法。
背景技術
微博作為實時性、交互性很強的社交媒體,為用戶提供了自由發表內容以及信息交換的平臺,已經成為人們爆料事件、發表觀點、分享經驗的首選媒體。現實中發生的很多事件在微博上都先有爆料,而后傳統的主流媒體才予以報道,比如,2013年的波士頓爆炸事件、撒切爾夫人的離世等等事件。面向微博的事件檢測已成為近期事件檢測領域的研究熱點。
由于微博的很多內容帶有地域信息,包括博文提及的地點,發表博文的用戶的注冊地點,以及博文附帶的地理標簽等,面向微博的局部地域事件檢測(Localized event)已經成為了新興的研究方向。這類事件檢測有一個基本假設,即當本地域沒有事件發生的時候,用戶很少會討論此類事件,一旦發生了,就會有大量的討論,比如地域發生火災、爆炸、洪水、交通事故、污染、疾病傳染等等事件。這與社交媒體的廣域事件檢測(Global event)有很大的不同,廣域事件檢測不考慮地域特性,面對的是媒體的整個信息流,不僅分析的工作量大,而且可能忽略了局部地域的熱點事件,已有的事件檢測方法難以直接應用到地域事件檢測之中。
在2010年美國出版的會議論文集:2010年第19屆國際萬維網會議(19thInternational World Wide Web Conference),題目為:基于Twitter用戶的地震檢測-通過社交傳感器實時檢測事件(Earthquake shakes Twitter users:real-time eventdetection by social sensors),作者是Takeshi Sakaki,Makoto Okazaki,YutakaMatsuo,該文把每個Twitter用戶模擬成無線傳感器網絡中的節點,用戶發表與地震相關的博文的過程被抽象成無線傳感器網絡中的節點發布自身采集到的信息行為,再通過博文的時間和空間模型及后續的濾波處理,對地震是否發生進行確認。但該方法需要人工設計一些查詢輸入項,難以應用到非常規的突發事件的檢測。
在2016年中國出版的期刊:現代圖書情報技術,題目為:基于地理坐標的微博事件檢測與分析,作者是:李進華,安仲杰,該文使用了微博數據的發布數、轉發數、評論數、用戶活躍度和移動強度5個指標構建微博的特征。該方法在檢測微博突發事件時,考慮到的微博類的社交媒體的特征并不全面,包括突發詞的頻率、地域突發性等,而且在計算各個指標時并沒有給出具體的計算方法(包括形式化的公式等等)。
在2016年美國出版的會議論文集:第39屆國際ACM信息檢索會議(39thInternational ACM SIGIR Conference on Research and Development in InformationRetrieval),題目為:GeoBurst:從地理標簽推特流中實時監測區域事件(GeoBurst:Real-Time Local Event Detection in Geo-Tagged Tweet Streams),作者是Zhang Chao,ZhouGuangyu,Yuan Quan,Zhuang Honglei,Zheng Yu,Kaplan Lance,Wang Shaowen,HanJiawei,該文首先在查詢窗口內識別一些重要微博作為中心軸點(Pivots),進一步通過與歷史數據在時空方面的比較得到突發事件。該方法是從微博文本信息的角度出發,由于微博比較短小,且用語不規范,直接從一些短小的單篇微博文本中難以提取出有效的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于淮海工學院,未經淮海工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710455550.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種瀏覽器無障礙插件
- 下一篇:一種漏洞信息采集方法和裝置





