[發明專利]臺風事件信息聚合方法有效
| 申請號: | 202011245204.3 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN112328794B | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 張雪英;葉鵬;懷安 | 申請(專利權)人: | 南京師范大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/31;G06F16/2455;G06F40/216;G06F40/284;G06F40/289;G06Q50/00 |
| 代理公司: | 南京銳恒專利代理事務所(普通合伙) 32506 | 代理人: | 陳思 |
| 地址: | 210046 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 臺風 事件 信息 聚合 方法 | ||
本發明涉及一種臺風事件信息聚合方法,主要步驟如下:步驟1、采集社交媒體中與臺風事件相關的消息文本,并從中抽取臺風事件信息,并轉換為結構化的信息元組形式;步驟2、基于多特征相似度的對象信息聚合;步驟3、基于時空特征的狀態信息聚合;步驟4、基于狀態的過程信息聚合:在對象信息聚合結果中篩選符合時間和位置范圍要求的時空節點信息,對這些時空節點分別進行狀態信息聚合,并將多個狀態信息聚合結果進行排序,形成體現動態特性的過程信息聚合結果。本發明的臺風事件信息聚合方法,對社交媒體中來源分散的臺風事件信息進行篩選、組織和整合,為探測臺風事件過程的發展階段和態勢提供有序化的信息基礎。
技術領域
本發明屬于大數據挖掘領域,具體涉及一種臺風事件信息聚合方法。
背景技術
臺風會對自然生態、社會經濟甚至人類可持續發展造成十分嚴重的破壞性影響,及時地獲取臺風事件演化過程的相關信息,成為災害應急響應的重要依據和參考。在當前大數據環境下,社交媒體憑借其高效的更新頻率、多源的傳播渠道和廣泛的參與程度,在災害管理中顯示出巨大的應用潛力,并逐漸發展為獲取臺風事件信息的新途徑。然而,由于社交媒體本身的短文本特性,也存在信息破碎度高、表達形式復雜多樣、信息粒度多樣化等特點。龐雜散亂的社交媒體信息不僅難以反映臺風事件演化的全貌,也阻礙了用戶對于臺風事件過程的有效探測。
信息聚合方法通過對信息資源的有效描述,來提高信息組織的合理性并優化訪問效率,以滿足用戶獲取有效信息資源的需求和便利性。面向災害事件的信息聚合方式主要包括基于統計的方法、基于主題模型的方法和基于知識元的方法:(1)統計方法是利用詞頻、TF-IDF、N-gram、互信息等統計特征計算信息單元中的關鍵詞權重,從中選取最具代表性的關鍵詞并基于此進行聚合。該類方法簡單主觀、易于理解,但由于關鍵詞篩選精度不高,一般需要結合輔助信息進行二次篩選。(2)概率主題模型假設每個文檔在所有主題詞上都存在一個潛在分布,可以利用主題詞概率分布表示信息單元中的主題。然而,該類方法的效果依賴于主題個數的確定,在現實中社交媒體中不同主題一直處于動態變化。社交媒體的同一條消息中可能包含多個主題的內容,也使得主題詞的可解釋性存在較大爭議。(3)知識元是對不同概念間的邏輯關系和層次結構進行定義,常見知識元形式有本體、語義網絡、關聯數據等。基于知識元的聚合是以知識元理論為基礎,通過構建描述災害事件結構的概念模型,根據模型中定義的語義關系進行信息重新序化和組織,以揭示信息特征及其關聯。
目前,基于統計和主題模型的方法是進行災害事件信息聚合最常用的方式。然而,這兩類方法聚合結果的信息粒度較粗,通常只是將與災害事件有關的各類信息集中在一起。相比較而言,基于知識元的聚合方法能夠依據災害領域的概念體系對原始資源進行分解和重組,獲得具有一定知識結構的深度聚合結果。但是現有的臺風事件知識建模多關注于臺風事件中各個概念的層次結構與關聯關系,忽略了對于臺風事件動態過程的描述與表達。面對海量且類型復雜的社交媒體資源分散分布的狀況,有必要構建信息聚合方法,依據事件的演化過程對臺風事件信息進行有序化整合。
發明內容
本發明的目的在于提供一種臺風事件信息聚合方法,對社交媒體中來源分散的臺風事件信息進行篩選、組織和整合,為探測臺風事件過程的發展階段和態勢提供有序化的信息基礎,也有利于應急管理中社交媒體資源服務能力的提升。
為實現上述目的,本發明提供如下技術方案:
臺風事件信息聚合方法,主要步驟如下:
步驟1、采集社交媒體中與臺風事件相關的消息文本,并從中抽取臺風事件信息,并轉換為結構化的信息元組形式;
步驟2、基于多特征相似度的對象信息聚合:依據對象名稱間的相似度判斷其是否屬于同一對象的信息元組,需要將描述同一對象的信息元組進行聚合;
步驟3、基于時空特征的狀態信息聚合:在對象信息聚合結果中篩選符合單一時間和位置條件要求的屬性值和行為值,時間信息、位置信息與篩選出的屬性值和行為值共同構成對象在特定時空下的狀態信息聚合結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京師范大學,未經南京師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011245204.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種橋梁施工用隔離帶
- 下一篇:一種機械零件加工除屑裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





