[發明專利]自然災害輿情分析方法和裝置有效
| 申請號: | 202011494854.1 | 申請日: | 2020-12-17 |
| 公開(公告)號: | CN112559844B | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 邵鎣俠;劉輝;王海江;廖健翔 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06Q50/00;G06F40/289;G06F16/35;G06K9/62 |
| 代理公司: | 北京金咨知識產權代理有限公司 11612 | 代理人: | 宋教花 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自然災害 輿情 分析 方法 裝置 | ||
1.一種自然災害輿情分析方法,其特征在于,該方法包括以下步驟:
創建多源社交媒體數據爬蟲,通過輸入數據采集條件參數進行數據采集,得到自然災害相關的社交消息數據,所述數據采集條件參數包括:自然災害類型關鍵詞、采集自然災害信息的多源社交媒體類型和社交媒體字段信息,所述社交媒體字段信息包括發布時間、發布內容、轉發數量、評論數量和用戶信息;
對爬蟲采集到的社交消息數據進行實體獲取,以從采集到的社交消息數據中抽取各社交消息對應的社交媒體消息的屬性信息和初始的自然災害描述信息,并基于抽取結果得到各社交消息對應的自然災害實體數據,所述自然災害實體數據包括社交媒體消息的屬性信息和標準格式化的自然災害描述信息;其中,所述初始自然災害描述信息包括:自然災害發生地信息、自然災害發生時間信息和自然災害等級信息;
設置自然災害信息表和社交消息緩存表分別記錄各自然災害和各社交消息,根據所述自然災害實體數據按照各自然災害事件對社交消息進行聚類,以生成聚類結果;所述自然災害信息表內容包括:災害編號、災害發生時間、災害發生地點和災害等級;所述災害編號為新災害信息填入時進行的自動編號;所述社交消息緩存表內容包括:社交消息編號、當前社交消息中的災害發生時間信息、當前社交消息中到的災害地點信息和當前社交消息中到的災害等級信息;
基于聚類結果進行自然災害輿情分析;
采集到的社交消息數據,進行實體獲取后存入社交消息緩存表中,所述社交消息編號為新社交消息填入時進行的自動編號;
所述對爬蟲采集到的社交消息數據進行實體獲取的步驟包括:從采集到的社交消息數據中抽取各社交消息對應的社交媒體消息的屬性信息和初始的自然災害描述信息,抽取社交消息中與自然災害類型關鍵詞文本位置最近的地名作為災害發生地點,在抽取結果中包含自然災害發生地信息、自然災害發生時間信息和自然災害等級信息的情況下,基于抽取結果得到標準格式化的自然災害描述信息:在抽取結果中不包含自然災害發生地信息情況下,將對應社交消息的發布地點標準化為標準格式化的自然災害發生地信息,填充并進行標記;在抽取結果中不包含自然災害發生時間信息的情況下,將對應社交消息的發布時間標準化為標準格式化的自然災害發生時間信息,填充并進行標記;在抽取結果中不包含自然災害等級信息的情況下,將自然災害等級范圍之外的特殊等級標識值作為標準格式化的自然災害等級信息填充;
所述根據所述自然災害實體數據按照各自然災害事件對社交消息進行聚類包括:將社交消息進行分類,基于社交消息的分類,將對社交消息進行聚類的方式分為不同聚類方式;
所述不同的聚類方式包括:
第一聚類方式,如果當前社交消息為轉發其他用戶所發布的消息,并且當前消息所轉發的原始消息在消息聚類結果存儲表中存在,則將當前消息標記與原始消息相同的災害編號,存入消息聚類結果存儲表;和
第二聚類方式,在確認當前社交消息的發布媒體為權威社交媒體的情況下,如果當前自然災害信息表中不存在判定相似的記錄,則在自然災害信息表中增加當前社交消息包含的災害記錄,并將當前社交消息和社交消息緩存表中與當前消息判定相似的所有社交消息的消息編號填入消息聚類結果存儲表中,并將此次存儲表填入的社交消息編號對應的災害編號標記為此次自然災害信息表新增加記錄對應的災害編號;
消息聚類結果存儲表中各社交消息編號對應的災害編號對應消息的聚類結果。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
可視化展示自然災害輿情分析的結果;
通過實時維護自然災害信息表實時檢測自然災害。
3.根據權利要求1所述的方法,其特征在于,
所述社交媒體消息的屬性信息包括以下信息中的一種或多種:發布時間、發布內容、轉發數量、評論數量和用戶信息。
4.根據權利要求1所述的方法,其特征在于,所述創建多源社交媒體數據爬蟲,通過輸入數據采集條件參數進行數據采集,得到自然災害相關的社交消息數據,包括:
創建多源社交媒體數據爬蟲,通過輸入數據采集條件參數進行數據采集;
使用分詞技術對爬蟲采集到的數據進行分詞處理,去掉停用詞;
對采集到的數據中的無用文本數據進行過濾,和/或將采集的數據中特定社交媒體類型發布的社交消息進行過濾,從而得到自然災害相關的社交消息數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011494854.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:體溫測量裝置
- 下一篇:船舶操縱系統中的航向角度自抗擾控制方法及相關裝置





