[發明專利]P2P-TV頻道特征碼出現規律的提取方法及基于其的P2P-TV頻道識別方法和識別系統有效
| 申請號: | 201010105437.3 | 申請日: | 2010-02-03 |
| 公開(公告)號: | CN101778115A | 公開(公告)日: | 2010-07-14 |
| 發明(設計)人: | 王暉;姜志宏;張鑫;李進;樊鵬翼 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L29/08;H04L12/24 |
| 代理公司: | 長沙正奇專利事務所有限責任公司 43113 | 代理人: | 盧宏 |
| 地址: | 410073湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | p2p tv 頻道 特征 出現 規律 提取 方法 基于 識別 系統 | ||
技術領域
本發明涉及P2P流量識別領域,更具體地說,涉及到網絡流量所對應的P2P-TV頻道的識 別技術。
背景技術
P2P-TV作為一種新興的網絡業務在網上迅速流行,人們可以很方便地利用P2P-TV平臺 觀看電視,電影等,現在網上流行的P2P-TV平臺有PPLive、PPStream、QQLive、UUSee、 SOPCast等等。這些平臺給人們帶來便捷的同時,同樣也帶來一系列的問題:基于P2P的應 用技術大規模的使用大量的占用了網絡帶寬;由于各采用不同的私有協議,容易脫離監管 的范圍;加之網絡本身的脆弱性,這些平臺很容易成為一些不法分子和反動勢力的攻擊對 象,使之成為傳播非法信息的渠道,危及到國家和社會的利益。所以加大對P2P-TV平臺的 監管顯得十分緊迫。
國內外許多研究機構進行了大量關于P2P-TV平臺的研究,主要集中在測量和識別兩個 方面。識別是監管的基礎,過去的工作主要集中在P2P-TV平臺的識別方面,這方面的技術 也逐漸趨向成熟,平臺識別的方法主要集中在以下兩個方面:
一是基于特征碼的識別,找出不同平臺應用層數據中的特種字碼段,形成特征庫,識 別的過程中從待識別流量中提取特征碼進行匹配。
二是基于行為特征的識別方法,該方法主要是根據包大小、傳輸層協議、端口數量、 會話持續時間等行為特征對P2P-TV平臺進行識別。
如今對P2P流媒體的平臺監管需更加精細化的控制,除了采用上述方法識別出平臺以 外,還需要識別出發生異常的具體頻道,因此對P2P流媒體的平臺內各頻道的進一步識別 變得非常有必要。
發明內容
針對上述現有技術,本發明的目的旨在提供一種P2P-TV頻道特征碼出現規律的提取 方法及基于其的P2P-TV頻道識別方法和識別系統,以便能夠在園區網的出口端識別出網 內哪些節點在觀看P2P-TV平臺內的哪些具體頻道,對園區網的數據進行更加精確的監控, 且該識別方法快速,易于實現,得出的識別結果準確無誤。
為了實現上述目的,本發明采取了如下技術方案:
一種P2P-TV頻道特征碼出現規律的提取方法,包括以下步驟:
步驟一,數據采集:數據采集在兩個不同的時間段分別進行,每次從連接于園區網的 PC上采集同一P2P-TV平臺的兩個頻道的兩段t時長的凈流量數據,其中兩次采集的兩個 頻道相同;
步驟二、數據處理:對采集到的四段數據流進行協議過濾和端口過濾,保留主要UDP 端口內的UDP數據,其中主要UDP端口是指t時長的采樣時間段內數據量最大的UDP端口;
步驟三、統計UDP數據中字節碼段的出現頻率:對于每一段數據流中所有數據包中的 有效載荷數據前n個字節,分別統計長度為m(m∈[4,l],4<l<n)字節的連續的字節碼段的 出現頻率,對n-3個統計結果按照出現頻率由大到小進行排序;
步驟四、分析字節碼段,初步得出頻道特征碼:對于同一平臺的兩個頻道,分別從每 個頻道的兩段不同的字節碼出現頻率統計結果中,找到字符完全匹配且出現頻率都比較大 的字節碼段;兩個頻道對應的這兩個字節碼段如滿足以下條件:1、兩個字節碼段的長度 相同;2、兩個字節碼段的內容不相同;3、兩個字節碼段的出現位置具有相同的規律;則 初步設定這兩個字節碼段為對應頻道的特征碼;
步驟五、檢驗初步得出的頻道特征碼:使用同一平臺不同頻道不同時間段的數據檢驗 兩個字節碼段的唯一性和恒定性,其中唯一性是指同一平臺其它頻道對應位置上的字節碼 段互為不同,恒定性是指該字節碼段在大于6個月的時間段內不發生變化;不能通過檢驗 則返回步驟四,通過檢驗則認為該字節碼段是該頻道的頻道特征碼;
步驟六、分析總結出頻道特征碼出現規律,包括頻道特征碼的包大小規律和位置規律, 其中包大小規律是指特征碼主要出現在大小為多少的數據包;所述位置規律是指頻道特征 碼主要出現在數據包中有效載荷數據中的哪個位置。
作為實施方案,步驟一中,所述兩個不同的時間段一般取時間差為一天以上。所述步 驟四中,出現頻率都比較大的字節碼段是指兩個字節碼段的出現頻率均位于出現頻率統計 結果的前5位。
基于上述P2P-TV頻道特征碼出現規律,本發明還提供一種P2P-TV頻道識別方法,包 括如下步驟:
(一)頻道特征庫建立
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010105437.3/2.html,轉載請聲明來源鉆瓜專利網。





