[發明專利]災情追蹤方法、系統、設備和存儲介質在審
| 申請號: | 202011231091.1 | 申請日: | 2020-11-06 |
| 公開(公告)號: | CN112231483A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 孫洪泉;杜治高;楊曉靜;蘇志誠;呂娟;武劍峰;李明;高輝;江鵬;王亞許;王肖 | 申請(專利權)人: | 中國水利水電科學研究院;誠安榮創(北京)信息科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/335;G06F16/951;G06F40/279;G06K9/62 |
| 代理公司: | 成都余行專利代理事務所(普通合伙) 51283 | 代理人: | 邢智勇 |
| 地址: | 100038 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 災情 追蹤 方法 系統 設備 存儲 介質 | ||
本發明提供一種災情追蹤方法、系統、設備和存儲介質,其中方法包括:獲取與旱情相關的原始信息;對原始信息進行提抽取信息、去重清洗、信息分類和情感分析;對處理后的信息進行統計分析。本發明通過深度學習對原始信息進行處理,實現對災情信息進行分類,最終進行統計分析和可視化,具有識別準確、效率高、分析全面和對災情的輿論進行實時監控等優點。
技術領域
本發明涉及旱情信息處理技術領域,尤其是涉及一種災情追蹤方法、系 統、設備和存儲介質。
背景技術
干旱通常指淡水總量少,不足以滿足人的生存和經濟發展的氣候現象, 一般是長期的現象,干旱從古至今都是人類面臨的主要自然災害。即使在科 學技術如此發達的今天,它造成的災難性后果仍然比比皆是。尤其值得注意 的是,隨著人類的經濟發展和人口膨脹,水資源短缺現象日趨嚴重,這也直 接導致了干旱地區的擴大與干旱化程度的加重,干旱化趨勢已成為全球關注 的問題。
隨著網絡的發展,使得信息會快速地進行傳播,一旦某地出現干旱,就 會在相關的網站上出現關于該地干旱的一些新聞報道,這些新聞報道有的是 正面的、客觀的報道,也有些是負面、歪曲事實的報道。為了社會的和諧發 展,對網絡上關于旱情的輿論監控顯得非常重要。但是在現有技術中,還沒 有相關技術對網絡上關于旱情的輿論進行監控。
發明內容
為了解決上述技術問題,本發明提供一種可以對旱情輿論進行監控的 災情追蹤方法、系統、設備和存儲介質。
本發明的一種技術方案是:提供一種災情追蹤方法,包括如下步驟:
獲取與災情相關的原始信息;
對原始信息進行提抽取信息、去重清洗、信息分類和情感分析;
對處理后的信息進行統計分析。
作為對本發明的改進,在對原始信息進行提抽取信息、去重清洗、信息分 類和情感分析的步驟中,提抽取信息包括:從原始信息中提取正文,并從正文中 抽取相關的內容信息。
作為對本發明的改進,在對原始信息進行提抽取信息、去重清洗、信息分類 和情感分析的步驟中,去重清洗包括:
去除重復的原始信息;
將原始信息清洗并分類成旱情信息和非旱情信息。作為對本發明的改進,在去 除重復的原始信息的步驟中,包括:
過濾掉重復的鏈接和過濾掉重復的內容。
作為對本發明的改進,在將原始信息清洗并分類成旱情信息和非旱情信息的 步驟中,包括:
從原始信息中獲取若干第一樣本信息并形成第一樣本文件;
將第一樣本文件分為第一測試集和第一驗證集;
對第一測試集中的第一樣本文件進行訓練得到第一訓練模型;
用第一驗證集檢驗第一訓練模型;
使用第一訓練模型將原始信息分類成旱情信息和非旱情信息。
作為對本發明的改進,在對原始信息進行提抽取信息、去重清洗、信息分類 和情感分析的步驟中,信息分類包括:將旱情信息分類成熱點信息和非熱點信息。
作為對本發明的改進,在將旱情信息分類成熱點信息和非熱點信息的步驟中, 包括:
從旱情信息中獲取若干第二樣本信息并形成第二樣本文件;
將第二樣本文件分為第二測試集和第二驗證集;
對第二測試集中的第二樣本文件進行訓練得到第二訓練模型;
用第二驗證集檢驗第二訓練模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國水利水電科學研究院;誠安榮創(北京)信息科技有限公司,未經中國水利水電科學研究院;誠安榮創(北京)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011231091.1/2.html,轉載請聲明來源鉆瓜專利網。





