[發(fā)明專利]自然災害輿情分析方法和裝置有效
| 申請?zhí)枺?/td> | 202011494854.1 | 申請日: | 2020-12-17 |
| 公開(公告)號: | CN112559844B | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計)人: | 邵鎣俠;劉輝;王海江;廖健翔 | 申請(專利權(quán))人: | 北京郵電大學 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06Q50/00;G06F40/289;G06F16/35;G06K9/62 |
| 代理公司: | 北京金咨知識產(chǎn)權(quán)代理有限公司 11612 | 代理人: | 宋教花 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自然災害 輿情 分析 方法 裝置 | ||
本發(fā)明提供一種自然災害輿情分析方法和裝置,所述方法包括:創(chuàng)建爬蟲實時收集自然災害相關(guān)的社交消息數(shù)據(jù);對收集到的數(shù)據(jù)進行社交媒體消息的屬性信息與自然災害描述信息的抽取,基于抽取結(jié)果得到各社交消息對應的自然災害實體數(shù)據(jù);設(shè)置自然災害信息表和社交消息緩存表分別記錄各自然災害和各社交消息,根據(jù)所述自然災害實體數(shù)據(jù)按照各自然災害事件對社交消息進行聚類,以生成聚類結(jié)果,并基于聚類結(jié)果進行自然災害輿情分析。本發(fā)明實施例的自然災害輿情分析方法和裝置,能夠大大提高多源社交媒體的自然災害輿情分析效率。
技術(shù)領(lǐng)域
本發(fā)明涉及社交媒體輿情分析領(lǐng)域,更具體而言,本發(fā)明涉及一種基于多源社交媒體實時聚類的自然災害輿情分析方法和裝置。
背景技術(shù)
近些年來我國自然頻發(fā),給人們的生命安全和財產(chǎn)安全都造成了巨大威脅,對經(jīng)濟的發(fā)展帶來了不利影響。我國自然災害具有種類多、分布地域廣、發(fā)生頻率高、造成損失重的特點,這使得災害發(fā)生前預警尤其重要。若災害發(fā)生前預警不及時,會導致災害附近人員無準備工作,最終造成不必要的經(jīng)濟甚至生命損失,若災害發(fā)生后消息傳遞不及時,會影響到對受到自然災害地區(qū)的救援效率,因此自然災害分析與實時檢測技術(shù)愈發(fā)重要。
近年來,隨著經(jīng)濟的發(fā)展我國社交媒體也得到了蓬勃發(fā)展,在社交媒體上存儲了大量的輿論信息,當前結(jié)合社交媒體進行自然災害輿情分析儼然已經(jīng)成為一個熱門的研究方向,但社交媒體種類多,信息量巨大,信息復雜,多類型多次自然災害輿論信息混合在一起,難以進行區(qū)分。當前基于社交媒體的自然災害輿情分析工作大多基于單源社交媒體上某種類型(如臺風、地震、暴雨等)的某一次或幾次自然災害進行手動采集數(shù)據(jù)。信息收集來源單一必然會導致輿情分析過于片面,難以對自然災害進行更廣泛的輿情分析與更高效的災害檢測,且該工作建立在大量的人力資源上,需要較多的人工參與來進行數(shù)據(jù)的采集,人工采集必然會導致效率低下,結(jié)果缺乏實時性。若想基于社交媒體針對某類型自然災害的每一次災害詳情進行輿情分析,采用上述方法需要花費更多的人力,使該方法缺乏自動性、實用性且效率低下的缺點更加明顯。
如何基于多源社交媒體實時聚類自動、高效地實現(xiàn)自然災害輿情的分析,是一個亟待解決的問題。
發(fā)明內(nèi)容
鑒于此,本發(fā)明提出了一種自然災害輿情分析方法和裝置,以消除或改善現(xiàn)有技術(shù)中存在的一個或更多個缺陷。
根據(jù)本發(fā)明的一方面,提出了一種自然災害輿情分析方法,該方法包括以下步驟:
創(chuàng)建多源社交媒體數(shù)據(jù)爬蟲,通過輸入數(shù)據(jù)采集條件參數(shù)進行數(shù)據(jù)采集,得到自然災害相關(guān)的社交消息數(shù)據(jù),所述數(shù)據(jù)采集條件參數(shù)包括:自然災害類型關(guān)鍵詞、采集自然災害信息的多源社交媒體類型和社交媒體字段信息;
對爬蟲采集到的社交消息數(shù)據(jù)進行實體獲取,以從采集到的社交消息數(shù)據(jù)中抽取各社交消息對應的社交媒體消息的屬性信息和初始的自然災害描述信息,并基于抽取結(jié)果得到各社交消息對應的自然災害實體數(shù)據(jù),所述自然災害實體數(shù)據(jù)包括社交媒體消息的屬性信息和標準格式化的自然災害描述信息;
設(shè)置自然災害信息表和社交消息緩存表分別記錄各自然災害和各社交消息,根據(jù)所述自然災害實體數(shù)據(jù)按照各自然災害事件對社交消息進行聚類,以生成聚類結(jié)果;
基于聚類結(jié)果進行自然災害輿情分析。
在本發(fā)明一些實施例中,所述方法還包括:可視化展示自然災害輿情分析的結(jié)果。
在本發(fā)明一些實施例中,所述社交媒體消息的屬性信息包括以下信息中的一種或多種:發(fā)布時間、發(fā)布內(nèi)容、轉(zhuǎn)發(fā)數(shù)量、評論數(shù)量和用戶信息;所述初始自然災害描述信息包括:自然災害發(fā)生地信息、自然災害發(fā)生時間信息和自然災害等級信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學,未經(jīng)北京郵電大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011494854.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





