[發明專利]基于隨機森林的周期性流量預測方法有效
| 申請號: | 202110267095.3 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN113067724B | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 張崗山;何丁樂;趙林靖;劉炯;吳煒 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | H04L41/0896 | 分類號: | H04L41/0896;H04L41/147;H04L43/0876;G06N20/00 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 王品華;黎漢華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隨機 森林 周期性 流量 預測 方法 | ||
1.一種基于隨機森林的周期性流量預測方法,其特征在于,包括如下步驟:
(1)采集各類別應用程序的流量數據;
(2)將每個數據流劃分為時間序列,提取每個時序點的八個特征,即序號k、時序點內數據包總字節數B1、時序點內最大數據包字節數B2、時序點內最小數據包字節數B3、時序點內平均數據包大小Ba、時序點內最大數據包發送時間間隔t1、時序點內最小數據包發送時間間隔t2、時序點內平均數據包發送時間間隔ta;
(3)構建周期指標確定算法:
(3a)計算數據流時間序列的周期起始點ns、周期大小Tc、周期相似度F這三個特征;
(3b)將步驟(3a)計算的這三個特征和步驟(2)中提出的k、B1、B2、B3、Ba、t1、t2、ta八種特征,作為第一訓練集,輸入到隨機森林算法,設置該算法的第一初始參數,對訓練集執行二分操作,將訓練集分為兩部分,再對每次二分后的訓練集重復執行二分操作,得到一個二叉樹結構,當樹結構到達設定樹的最大深度20時,停止二分操作,訓練結束,得到用于確定時間序列的周期指標確定算法;
(4)構建數據預測算法:
(4a)求出時間序列中ns+1至最后一個點ne的每個時序點k在周期中的相對位置nq及所處周期的序號Tq;公式如下:
nq=(k-ns)mod Tc,
其中,ns為時間序列的周期起始點、Tc為時間序列的周期大??;
(4b)將步驟(4a)求出的兩個參數與步驟(3)中的ns、Tc、F和步驟(2)中的B1、k這些特征作為第二訓練集,輸入到隨機森林算法,設置該算法的第二初始參數,對訓練集執行二分操作,并對每次二分后的訓練集重復執行二分操作,得到一個二叉樹結構,當樹結構到達設定樹的最大深度18時,停止二分操作,訓練結束,得到用于預測時序點數據大小的數據預測算法;
(5)通過周期指標確定算法和數據預測算法對未知數據流進行預測:
(5a)使用步驟(2)中的方法統計未知數據流前N個時序點中每個時序點的八種時序特征k′、B1′、B2′、B3′、Ba′、t1′、t2′、ta′,并將這N個時序點的八個特征全部輸入到周期指標確定算法中,輸出該數據流的周期起始點ns′、周期大小Tc′、周期相似度F′,其中,N為步驟(3)中所有時間序列中ns的最大值;
(5b)根據步驟(5a)得到未知數據流的周期起始點ns′、周期大小Tc′、周期相似度F′,提取出ns′之后的所有時序點,使用步驟(4a)中的方法求出這些時序點的周期特征k′、Tq′、nq′,并將ns′、Tc′、F′和所有時序點的k′、Tq′、nq′共六個特征,輸入到數據預測算法中,輸出各個時序點的預測數據值。
2.根據權利要求1所述的方法,其特征在于,步驟(1)中采集各類別應用程序的流量數據,采取被動監聽方式獲取應用運行過程中的數據包及數據包的信息:每個數據包的字節數大小Bi、數據包發送時刻tk和數據包發送間隔Δk。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110267095.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鏡頭、攝像模組及電子設備
- 下一篇:一種兩點固定的汽車后蓋電泳接漆輔具





