[發明專利]一種基于SVM模型的互聯網文本氣象災害事件識別方法在審
| 申請號: | 202110980162.6 | 申請日: | 2021-08-25 |
| 公開(公告)號: | CN113761914A | 公開(公告)日: | 2021-12-07 |
| 發明(設計)人: | 馮宇星;唐衛;張雪英;王慕華;崔磊;豐徳恩;李雁鵬;趙文強;王益鵬;朱旭凡;姜寶杰 | 申請(專利權)人: | 中國氣象局公共氣象服務中心(國家預警信息發布中心);南京大峽谷信息科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06N20/10 |
| 代理公司: | 北京卓愛普專利代理事務所(特殊普通合伙) 11920 | 代理人: | 王玉松 |
| 地址: | 100081 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 svm 模型 互聯網 文本 氣象 災害 事件 識別 方法 | ||
本發明涉及一種基于SVM模型的互聯網文本氣象災害事件識別方法,該互聯網氣象災害事件識別SVM模型通過構建第一觸發詞庫、構建第一特征向量、構建最佳參數配置的氣象災害事件識別SVM分類器得到;進而通過該SVM模型,基于第一觸發詞庫,識別目標文本中的第一觸發詞并構建相應的第一特征向量,并輸入最佳參數配置的氣象災害事件識別SVM分類器,統計所有SVM分類器的輸出結果,將其中次數最多的氣象災害事件作為目標文本所描述的氣象災害事件,并輸出對應的氣象災害事件標簽。本發明可以從海量互聯網輿情數據中高效準確的挖掘出與氣象災情相關的信息,并可以篩選出疑似關于氣象災害的網絡謠言。
技術領域
本發明涉及氣象技術領域以及自然語言處理技術領域,具體涉及一種基于SVM模型的互聯網文本氣象災害事件識別方法。
背景技術
氣象災害是指大氣對人類的生命財產和國民經濟建設及國防建設等造成的直接或間接的損害,主要包括臺風、干旱、高溫、山洪、雷暴、沙塵暴等。氣象實況數據、預報數據和互聯網輿情監測數據存在顯著的優勢互補特性,具有多元性、豐富性、動態性和關聯性等特征。近年來隨著人工智能發展迅猛,人工智能技術被應用在尤其是以自然語言為主要載體的網絡輿情數據的處理和挖掘上。
支持向量機(Support Vector Machine,SVM)是一種有監督機器學習模式下的數據分類、模式識別、回歸分析模型。作為對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面,通過考慮尋找一個滿足分類要求的超平面,并且使訓練集中的點距離分類面盡可能的遠。支持向量機應用在文本分類中,首先通過對訓練集進行測試,得到樣本類別,然后依據得到的類別對測試集進行分類。中國專利CN112818668 A公開了一種氣象災情數據語義識別分析方法和系統,建立基于詞向量的線性支持向量機分類模型,對案件發生情況描述進行分詞后再進行文本分類,最終實現自動識別網絡輿情中的氣象災害和災害相關的信息。
然而,網絡氣象輿情數據存在稀疏性、不確定性、模糊性等缺點。因此,亟待大力推進新技術新方法,以實現網絡氣象災害輿情信息的動態感知、深度挖掘和智能分析,提高對氣象災害的信息獲取、預報預測能力,監控網絡氣象輿情的傳播,及時扼制關于氣象災害的網絡謠言。
發明內容
針對以上技術問題,本發明提出一種基于SVM模型的互聯網文本氣象災害事件識別方法,具體包括以下四個方面的技術方案:
第一,提出一種互聯網氣象災害事件識別SVM模型的構建方法,包括:
(1)構建第一觸發詞庫步驟:
采集所有氣象災害事件的觸發詞并存儲為第一觸發詞,所述第一觸發詞包括與氣象事件直接相關的名詞、描述氣象事件行為的動詞和描述氣象事件結果的形容詞;
(2)構建第一特征向量步驟:
選取與所述第一觸發詞在同一語句下并相鄰的詞,并根據每種氣象災害事件的語義特征,生成以所述第一觸發詞為核心的第一特征向量;
(3)構建最佳參數配置的氣象災害事件識別SVM分類器步驟:
對所有氣象災害中的任何兩種不同氣象災害,分別設置一個氣象災害事件識別SVM分類器用于區分所述兩種不同氣象災害;
獲取第一訓練集,所述第一訓練集為從互聯網采集到的一部分文本,所述第一訓練集經過人工識別并標注氣象災害事件標簽;
使用所述第一訓練集進行訓練,獲得最佳參數配置的氣象災害事件識別SVM分類器。
第二,提出一種互聯網文本氣象災害事件的識別方法,包括:
(1)基于第一觸發詞庫,識別目標文本中的第一觸發詞并構建相應的第一特征向量;
(2)將所述第一特征向量輸入最佳參數配置的氣象災害事件識別 SVM分類器;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國氣象局公共氣象服務中心(國家預警信息發布中心);南京大峽谷信息科技有限公司,未經中國氣象局公共氣象服務中心(國家預警信息發布中心);南京大峽谷信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110980162.6/2.html,轉載請聲明來源鉆瓜專利網。





