[發明專利]一種基于時間滑動窗口的互聯網流量建模方法在審
| 申請號: | 201410425563.5 | 申請日: | 2014-08-27 |
| 公開(公告)號: | CN105376105A | 公開(公告)日: | 2016-03-02 |
| 發明(設計)人: | 吳曉非;禹可 | 申請(專利權)人: | 蘇州大數聚信息技術有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L12/807;G06F17/30 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林;汪慶朋 |
| 地址: | 215137 江蘇省蘇州市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 時間 滑動 窗口 互聯網 流量 建模 方法 | ||
技術領域
本發明涉及互聯網流量建模技術領域,具體涉及一種基于時間滑 動窗口的互聯網流量建模方法。
背景技術
隨著近年來網絡技術、規模和業務的發展,互聯網已經成為人類 社會的重要基礎設施,它從根本上改變了人們以前的交流方式和生活 方式。互聯網的繁榮帶來了許多新的挑戰,網絡流量爆炸式增長,應 用變化發展和推陳出新的速度非常迅速,用戶行為趨于復雜化。互聯 網流量建模有助于把握應用流量特征,為流量預測、網絡維護、網絡 設施升級、網絡安全防御等提供基礎的數據支撐能力,具有明顯的現 實意義。
流量建模是網絡測量領域的一個重要方面,產生了種類繁多的網 絡流量模型。傳統的流量模型包括泊松模型、馬爾可夫模型、自回歸 模型等。最早的泊松模型是根據電話業務流量的特征提出來的,是指 在時間序列t內,呼叫或數據包到達的數量符合參數為t的泊松分布, 其相應的呼叫或包到達的時間間隔序列呈負指數分布。馬爾可夫模型 針對分組交換網絡流量,每次狀態轉換代表一個新的到達,未來狀態 只依賴于當前狀態,而描述一個狀態持續時間的隨機變量的分布呈指 數分布(連續時間)或幾何分布(離散時間)。自回歸模型采用自動 回歸法,強調時間序列未來的點數由同一時間序列過去的值來決定。 上述流量模型只存在短相關性,即在不同的時間尺度上有不同特性, 并且大量源疊加會平緩突發性,與實際數據網絡流量特征存在較大的 偏差。
互聯網研究人員隨后發現實際業務流在各個時間尺度下表現出 自相似的突發特性,在相關函數上表現為長相關特性,又相繼提出了 若干長相關模型,包括重尾分布的ON/OFF模型、分形布朗運動模型、 FARIMA模型等。重尾分布的ON/OFF模型首先疊加大量的ON/OFF 源,每個源都有兩個狀態,即周期交替的ON和OFF,在ON狀態中, 數據源連續地發送數據包;在OFF狀態中,數據源不發送任何數據包。 每個發送源的ON狀態和OFF狀態的時長獨立地符合重尾分布(如 Pareto分布)。分形布朗運動模型是一種統計自相似過程的數學模型, 它是一個均值為0的連續高斯過程,其平穩增量過程是分形高斯噪 聲。FARIMA模型是一個時間序列模型,它是一個二階漸進自相似過 程,通過3個參數來控制自相關結構。上述流量模型可以描述流量的 突發性和長相關性,刻畫了業務流量的自相似特性。
以上流量模型大多從純粹的數學角度對網絡流量的性質進行挖 掘,通過包長、包到達時刻、包到達時間間隔、包突發數量等微觀性 質的數學描述,試圖找出最有效的建模方式,但卻忽略了網絡流量的 現實意義,即流量是為網絡交互而產生,天然具有多個參與者的特性, 而不僅僅是通信單方或雙方的問題。此外,現有的一些長相關流量模 型存在較高的計算復雜度,由于其結構復雜、參數眾多,導致算法收 斂速度慢,已無法實際應用于網絡流量管理和預測中。
發明內容
針對現有技術存在的不足,本發明目的是提供一種基于時間滑動 窗口的互聯網流量建模方法,引入時間滑動窗口,既表征了網絡流量 的動態變化特性,又避免了流量的時間累積效應,降低了模型的分析 處理復雜度。
為了實現上述目的,本發明是通過如下的技術方案來實現:
本發明的一種基于時間滑動窗口的互聯網流量建模方法,具體包 括以下幾個步驟:
(1)通過網絡中的流量監控設備對不同時刻產生的流信息進行 采集,采集到的每個流信息對應一條流記錄;
(2)根據步驟(1)采集到的流信息建立流量圖,流量圖的建圖 方法如下:
將流記錄中的源主機和目的主機作為節點,將源主機和目的主機 之間的流量交互作為邊,將邊上的流量交互總和設為邊的權值,節點 的強度為與它相連的所有邊的權值總和;
(3)利用時間窗口的滑動對流量圖進行迭代更新,時間窗口包 含窗口大小W和滑動時間間隔τ兩個參數,具體迭代更新方法如下:
(1a)在時間窗口W1中,通過步驟(2)的建圖方法建立一個 流量圖G1;
(2a)將時間窗口W1往后滑動τ,從而形成時間窗口W2,并 對流量圖G1進行更新,具體更新方法如下:
若時間窗口W2包含了新的流記錄,則在流量圖G1上增加新的 節點和邊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大數聚信息技術有限公司,未經蘇州大數聚信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410425563.5/2.html,轉載請聲明來源鉆瓜專利網。





