[發明專利]一種基于SDN架構的業務識別方法有效
| 申請號: | 201810251707.8 | 申請日: | 2018-03-26 |
| 公開(公告)號: | CN108460423B | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 潘成勝;楊力;魏德斌;石懷峰;劉勇 | 申請(專利權)人: | 大連大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 大連智高專利事務所(特殊普通合伙) 21235 | 代理人: | 蓋小靜 |
| 地址: | 116622 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 sdn 架構 業務 識別 方法 | ||
1.一種基于SDN架構的業務識別方法,其特征在于,具體包括以下步驟:
A、設計一種在線學習框架;
B、篩選適用于空間信息網絡的在線流流量分類特征;
C、訓練分類器;
一種在線學習框架,包括離線訓練和在線分類兩個階段;
離線訓練階段:獲取實時業務流量數據作為訓練集,通過提取流量特征和對樣本進行部分標記,實現基于Dif-TriTraining算法的訓練分類器;所述Dif-TriTraining算法是以一定比例選取樣本集中距離較小的樣本,將選取出的樣本放入主分類器數據集中再次進行訓練得到最終的分類器;
在線分類階段:抓取實時網絡流量并進行特征提取,使用分類器進行流量分類,以獲得分類結果;
在線流流量分類特征包括:(1)基于包的統計特征的選取:把選取流中前N個數據包作為一條子流,統計子流中最大包、最小包、平均包的大小、平均到達時間間隔的均值作為統計特征;(2)基于流的統計特征的選取:流大小、流的持續時間,相鄰兩數據包到達時間間隔最小值作為統計特征;
訓練分類器的具體步驟如下:假設初始已標記樣本集為L,未標記樣本集為U;
C1、采用可放回隨機抽樣方法從初始已標記樣本集L中獲取三個有差異性的已標記樣本集,再使用分類算法對這三個有標記數據集進行訓練,得到三個初始分類器A、B、C;
C2、選擇其中任意一個為主分類器,假設A為主分類器,B和C為輔助分類器,然后利用輔助分類器B和C對未標記樣本集U進行分類,做分類結果標記,將標記相同的樣本與相應的標記組合成集合Xa;統計集合Xa樣本個數,假設為K1;
C3、計算每個樣本xi屬于Xa的樣本差距;樣本差距計算公式如下:
其中,dis(xi)表示樣本xi的樣本差距,N是樣本的維度,xik表示xi第k維上的值;
C4、從Xa中選擇K2個dis(xi)值最小的樣本,根據輔助分累器的分類結果進行標記,并將標記后的樣本加入主分類器對應的已標記樣本集進行擴展,然后重新訓練該分類器,獲得Xa';K2的計算公式為:
K2=[select_rate*K1]
其中,select_rate∈(0,1)是樣本差異較小的樣本所占比例;
C5、訓練結束,Xa'則為訓練后最終的分類器。
2.根據權利要求1所述一種基于SDN架構的業務識別方法,其特征在于,上述方法是在空間信息網絡架構中實施的,將空間信息網絡控制平面和轉發平面分離,該架構包括應用層面、控制層面和轉發層面組成。
3.根據權利要求2所述一種基于SDN架構的業務識別方法,其特征在于,在空間信息網絡架構下,使用在控制層面在線收集OpenFlow交換機轉發過來的數據包并進行特征統計使用分類器來進行業務分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連大學,未經大連大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810251707.8/1.html,轉載請聲明來源鉆瓜專利網。





