[發明專利]一種基于輿情分析的網絡流量檢測方法有效
| 申請號: | 202011554194.1 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112597141B | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 張志偉;李鋼鋒;梁衛國;郭棟;王文輝;劉達;孫衡;徐曉強;王淦;呂顯斌;曹華;齊云雷;閆昊;劉震;李鑫;王少偉;焦健 | 申請(專利權)人: | 國網山東省電力公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/2458;G06K9/62;G06N3/08;H04L47/2441 |
| 代理公司: | 北京嘉途睿知識產權代理事務所(普通合伙) 11793 | 代理人: | 彭成 |
| 地址: | 250001 *** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 輿情 分析 網絡流量 檢測 方法 | ||
本發明涉及一種基于輿情分析的網絡流量檢測方法,通過將原始的流量數據讀入,獲取時序特征數據,根據五元組信息將所有流量數據按照數據流進行劃分,提取數據流統計特征與負載特征,結合時序特征數據初步預測輿情流量;對特征集進行數據清洗,去除孤立森林提取的噪聲樣本,通過不放回的隨機抽樣方法將去噪后的特征集分為訓練集和測試集;根據訓練集和測試集,對初步預測的輿情流量進行確認,并基于所述輿情流量的影響力確定所述輿情流量的輿情流量類型。該方法有效提高輿情流量預測精度,進一步減小了預測誤差,增強預測效果實現了網絡輿情分析系統的自適應深度學習,以動態視角去挖掘關鍵節點及其演化規律,有針對性地根據網絡多種輿情情形提出基于影響力的檢測辦法。
技術領域
本發明涉及信息源影響力評估及深度學習技術領域,尤其涉及一種基于輿情分析的網絡流量檢測方法。
背景技術
信息源質量是輿情大數據的準確性及質量保證的前提條件,為了輿情數據能夠為輿情分析以及輿情預測提供準確的數據支撐,于是如何從海量信息源中評估出優質信息源也成為了重中之重。
如何有效評估輿情信息源是一項極具挑戰性的任務,國內外的網站影響力評價方法主要有兩種:定性方法和定量方法。當前大多數的影響力評價的研究都是使用定量的方法:即基于網絡計量學的角度,通過入鏈接數、出鏈接數、網絡影響因子、網站的訪問量等一些可量化的指標來對網站影響力進行評價分析。但是,很少有對網絡輿情信息源影響力的評價工作,并且幾乎未有將深度學習技術應用到輿情信息源影響力評估上的方法。
輿情信息的發出者是信息源,收受者是網民。信息源通過發布信息、轉載信息或引用信息等方式向網民傳播輿情信息。同時,網民通過發表文章、點擊、回復等方式表達對各種輿情信息的感興趣程度,這些方式也隱含了網民被信息源影響的程度。因此,在評價網絡輿情信息源影響力時,首先,要考慮信息源的自身表現力,該表現力可通過發表文章的頻率等信息因素體現。此外,由于網絡輿情是通過互聯網傳播的,人們受各種事件的刺激而產生的對于該事件的所有認知、態度、情感和行為傾向的集合。而網民作為輿情信息源影響的接收者,在網絡輿情傳播中也占有非常重要的地位。因此,在評價影響力時,還要考慮網民對信息源的關注度。該關注度可通過信息源發布信息的頻率,以及網民對信息的點擊頻率、回復頻率等得以體現,最后,還要考慮信息源與輿情主題的契合度。
社交媒體的信息爆炸標志著大數據時代的來臨。然而,伴隨著網絡用戶的各種亞文化圈子的形成,大量的非規范表達不斷產生,這些文字的使用組成了龐大的網絡中文語料庫。這些非規范表是中文表達中的主要組成部分,對中文自然語言處理的效果有至關重要的意義?,F有的網絡識別系統大多是基于詞庫的傳統系統,這種系統對非規范表達識別的準確性比較差,如果依舊采用傳統的基于詞庫的方法,這些非規范表達往往無法被準確識別出來,從而造成一些重要信息的丟失和誤判,給自然語言處理輿情分析和相關任務帶來很多問題和挑戰。在網絡信息爆炸式增長的時代,很多網絡社交都使用非規范表達來進行交流,使得網絡社交環境和網絡輿情非常復雜?;谏疃葘W習的網絡輿情分析系統能夠有效地分析出實際的網絡輿情,所以這一系統的建立就顯得非常重要。
發明內容
為了解決當前網絡流量數據中輿情數據的監測和識別,本申請請求保護一種基于輿情分析的網絡流量檢測方法。
本申請請求保護一種基于輿情分析的網絡流量檢測方法,其特征在于,包括:
將原始的流量數據讀入,獲取時序特征數據,根據五元組信息將所有流量數據按照數據流進行劃分;
提取數據流統計特征與負載特征,結合時序特征數據初步預測輿情流量;
對特征集進行數據清洗,去除孤立森林提取的噪聲樣本,通過不放回的隨機抽樣方法將去噪后的特征集分為訓練集和測試集;
根據訓練集和測試集,對初步預測的輿情流量進行確認,并基于所述輿情流量的影響力確定所述輿情流量的輿情流量類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網山東省電力公司,未經國網山東省電力公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011554194.1/2.html,轉載請聲明來源鉆瓜專利網。





