[發明專利]基于粒子群優化算法的視頻流特征選擇與分類方法在審
| 申請號: | 201710032385.3 | 申請日: | 2017-01-16 |
| 公開(公告)號: | CN106897733A | 公開(公告)日: | 2017-06-27 |
| 發明(設計)人: | 董育寧;馮茂 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/00 |
| 代理公司: | 南京知識律師事務所32207 | 代理人: | 李湘群 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 粒子 優化 算法 視頻 特征 選擇 分類 方法 | ||
技術領域
本發明屬于模式識別與分類技術領域,特別涉及一種基于粒子群優化算法的視頻流特征選擇與分類方法。
背景技術
隨著互聯網和流媒體技術的迅速發展,網絡中的視頻業務的增長尤為迅速。與此同時,網絡中新的應用和協議的不斷快速出現,使得網絡環境更加復雜。各種類型的網絡應用和網絡流量的急速增加,給網絡服務提供商帶來了極大的挑戰。如何有效地進行網絡管理、保證不同業務的服務質量和用戶的信息安全已成為迫切需要解決的問題。對于網絡服務提供商和網絡環境管理者來說,快速準確地識別出網絡中的不同業務流是一種行之有效的解決方案。
傳統的網絡流量識別和分類方法主要有基于端口的方法、基于深度包檢測的方法?;诙丝诘淖R別方法是根據國際互聯網代理成員管理局建議的端口號來區分不同的網絡應用,隨著動態端口號的廣泛應用,使得這種方法的識別效率和分類準確度不高?;谏疃劝鼨z測的方法的原理是通過解析數據包的載荷,與已知協議中特定的簽名進行比較,從而區分不同的業務。但是隨著網絡數據加密的普及和用戶隱私保護等問題,導致基于深度包檢測的網絡流量分類方法不再適用。基于統計特征的方法通過提取數據流的統計特征對數據流進行分類。這種方法既可以克服傳統方法的缺點,又具有較高的準確性和穩定性。因此,基于網絡流統計特征結合機器學習方法被廣泛地應用到網絡業務流識別領域。
從網絡業務流可以提取大量的統計特征,如何選擇合理的特征組合是提高分類精度的關鍵所在。許多研究表明,特征之間的不相關或冗余的特征會引發過擬合問題,進而嚴重影響分類結果的準確性。同時,高維的特征集合還會給分類器帶來大量的計算開銷和時延。因此,選取簡單、容易獲取的特征組合對分類器性能的提高有著重要的作用。
發明內容
本發明的目的在于針對網絡視頻業務流的統計特征選擇以及識別分類問題,提出了一種基于粒子群優化算法的視頻流特征選擇與分類方法,該方法針對在線標清視頻(非直播)、在線高清視頻(非直播)、在線超清視頻(非直播)、在線直播視頻、HTTP 下載、即時通信類視頻、P2P類視頻七種業務進行分析和研究,提出一種基于粒子群優化算法的視頻流特征選擇方法,經過三層SVM級聯分類器對原始的視頻業務流進行分類。實驗結果表明,本發明方法能夠比現有同類方法獲得更高的分類準確率。
為實現上述目的,本發明提出的技術方案是一種基于粒子群優化算法的視頻流特征選擇與分類方法,包括以下步驟:
步驟1:在開放的互聯網環境中使用網絡封包分析軟件獲取所需的實驗數據,然后對數據包進行過濾,最后對這些網絡視頻業務流進行基本的統計特征計算;
步驟2:對上述計算得出的視頻業務流的統計特征進行分析,選擇出能有效區分業務流的特征組合;
步驟3:根據設計的三層SVM級聯分類器對原始的視頻業務流進行分類實驗,得到最終的分類結果。
進一步,上述步驟1又具體包括:
步驟1-1:在開放的互聯網環境中,通過網絡封包分析軟件抓取所需的視頻業務流數據,然后對原始的數據進行簡單預處理,轉換成標準的五元組文本格式,即數據包到達的時間、源IP地址、目的IP地址、協議、數據包分組大??;
步驟1-2:對數據包過濾是指濾除不感興趣或者不會對分類結果產生影響的數據包;
步驟1-3:對原始視頻流的標準五元組文件進行基本的統計特征計算,這些特征包括:包大小、包大小的均值與方差、包大小信息熵、包間隔的均值與方差、字節速率、分組速率、上下行字節數之比、上下行包大小之比。
上述步驟2還具體包括:
步驟2-1:對所有視頻業務流的統計特征進行離散化操作,降低特征選擇過程中的計算開銷;
步驟2-2:利用特征權重算法計算每個統計特征的權重;
步驟2-3:根據特征權重的排名,去掉部分與類別關聯較小的特征,選取權重最大的N個特征,降低原始特征空間的維數,減少后續操作的計算復雜度;
步驟2-3:在上一步選取的N個特征子集中,選取特征權重排名靠前的M個特征作為先驗知識,指導粒子群優化算法的種群初始化,將每個粒子的初始位置設為最優位置;迭代次數設為1;
步驟2-4:將不一致率作為粒子群優化算法的適應度函數,利用適應度函數計算粒子的整體適應度,將樣本實例中的一個特征組合稱為一個模式,特征子集的所有模式的不一致數,就等于該模式出現的樣本總數減去出現次數最多的某一類標簽的樣本數,不一致率就等于不一致數除以樣本總數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710032385.3/2.html,轉載請聲明來源鉆瓜專利網。





