[發明專利]基于多層聚類的網絡視頻流分類方法有效
| 申請號: | 201410432130.2 | 申請日: | 2014-08-27 |
| 公開(公告)號: | CN104244035B | 公開(公告)日: | 2018-10-02 |
| 發明(設計)人: | 董育寧;姚利濤 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | H04N21/266 | 分類號: | H04N21/266;H04N21/24;H04N21/462;H04N21/458 |
| 代理公司: | 南京知識律師事務所 32207 | 代理人: | 汪旭東 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多層 網絡 視頻 分類 方法 | ||
1.基于多層聚類的網絡視頻流分類方法,其特征在于,所述方法步驟包括:
步驟1:在開放的網絡環境中獲取所需的視頻業務數據,對原始的視頻數據流進行基本的流量統計特征計算,包括:
步驟1-1:在開放的網絡環境中,通過WireShark網絡分析工具抓取所需的網絡視頻數據流,然后將抓取的原始數據流保存成包含五列數據的標準文本格式,其中包括包到達時間、源IP地址、目的IP地址、協議、包尺寸五列原始信息;
步驟1-2:對原始的視頻數據流進行基本的流量統計特征計算,這些特征包括:包尺寸、包到達時間間隔、字節速率、分組速率、包大小的信息熵、包到達時間間隔的概率密度函數、包到達時間間隔的累積密度函數;
步驟2:對上述的基本流統計特征進行統計分析,選取具有實際意義的QoS相關的統計特征,包括:
步驟2-1:通過對基本的流統計特征進行統計分析和實驗驗證,得出具有區分效果的QoS相關的統計特征;
步驟2-2:對于區分實際分析的網絡視頻流選取四個QoS特征,其中,QoS特征包括:
1)下上行字節數之比;
下上行字節數之比即一條流中去除開銷之后剩余的數據中下行字節數與上行字節數的比值;
2)下行包大小的信息熵;
下行包大小的信息熵可用來衡量一條流下行包大小的分布均勻程度,該值越大,說明某種業務的包大小分布越均勻;
3)下行子流片段數目;
連續的出現相同源IP的數據包稱為子流片段,這些IP地址能重復;對稱業務流中的子流片段數目較多;
4)下行有效IP數目;
定義持續時間大于0.5秒的IP地址為有效IP地址;下行有效IP數目是指下行數據中總的持續時間大于0.5秒的源IP地址數目的總和;
步驟3:將獲得的特征進行組合來標識原始的網絡數據流,通過多層聚類分類器的多層聚類識別,得到最后的分類結果,包括:
步驟3-1:由于對稱業務和非對稱業務在下上行字節數之比和下行子流片段數目這兩個特征上有很大的差異,因此選取該二維特征空間作為區分對稱視頻業務和非對稱視頻業務的特征組合;
步驟3-2:對稱視頻業務中的QQ、Xunlei和Sopcast這三種業務:QQ的下行包大小的信息熵較后兩者明顯偏大,而Sopcast的下行包大小的信息熵比其余兩種都要小,Xunlei的下行包大小的信息熵跨度較大,但與其余兩者也都有區分度,并且在下行子流片段數目這維特征空間上QQ與Xunlei、Sopcast也有明顯的區別,選取下行包大小的信息熵和下行子流片段數目作為區分對稱業務的有效特征組合;
步驟3-3:非對稱標清、非對稱高清和HTTP下載這三種業務:HTTP下載是一種傳統的應用類型,它類似于FTP服務,只是兩個IP之間的交互,因而該業務的有效IP數目必然較少,而對于非對稱的高清和標清業務,雖然某一時刻也同樣是兩個IP之間的信息交互,但是所要獲取的資源不僅僅存在于一個視頻服務器中,由于網絡環境的影響,與當前連接的服務器斷掉了,這樣本地IP就要重新獲取其他服務器上的資源,因而這兩種業務的下行有效IP數目必然偏多,采用這個特征能將HTTP下載和非對稱的標清、高清區分開,對于非對稱的標清和高清而言,從現有的特征空間看,只有下上行字節數之比能將他們分開;
步驟3-4:采用所述的特征組合表示原始的網絡視頻流,采用核函數的FCM進行多層聚類,包括如下步驟:
步驟3-4-1:將所有的原始數據流使用二維特征矢量(Ti,Tj)標識進行第一層聚類,得到兩大類聚類結果C1,C2;
步驟3-4-2:對一層聚類結果C1,C2的數據流分別使用特征矢量Vi,Vj進行標識,進行第三次聚類得到聚類結果C21,C22;
步驟3-4-3:對上述步驟3-4-2中的聚類結果采用同樣的方法再次進行聚類,直到最終的聚類結果等于給定的類別數就停止;
步驟3-4-4:統計聚類輸出結果;
所述方法的流量的獲取及統計特征的計算:通過網絡分析工具WireShark在開放的網絡環境中獲取待分析的網絡視頻數據,其中包括非對稱標清、非對稱高清、HTTP下載、交互式視頻通信類、P2P文件共享類、網絡在線直播類六類視頻應用,將獲取的網絡視頻流數據保存成TXT文檔格式,即為一條流,其中包含5列,從左至右依次是包到達時間、源IP地址、目的IP地址、協議、分組大小,流是指同種業務在30分鐘時間內所抓取的數據包序列,在此稱其為一條流,每種業務都抓取60條流來分析問題,然后,將原始的視頻流輸入到網絡數據流處理平臺,進行統計特征計算,最后得到一系列的網絡視頻流的QoS相關的統計特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410432130.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:車載導航系統的流媒體播放器及播放方法
- 下一篇:制瓶機口鉗夾具機構





