[發明專利]P2P-TV頻道特征碼出現規律的提取方法及基于其的P2P-TV頻道識別方法和識別系統有效
| 申請號: | 201010105437.3 | 申請日: | 2010-02-03 |
| 公開(公告)號: | CN101778115A | 公開(公告)日: | 2010-07-14 |
| 發明(設計)人: | 王暉;姜志宏;張鑫;李進;樊鵬翼 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L29/08;H04L12/24 |
| 代理公司: | 長沙正奇專利事務所有限責任公司 43113 | 代理人: | 盧宏 |
| 地址: | 410073湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | p2p tv 頻道 特征 出現 規律 提取 方法 基于 識別 系統 | ||
1.一種P2P-TV頻道特征碼出現規律的提取方法,其特征是包括以下步驟:
步驟一,數據采集:數據采集在兩個不同的時間段分別進行,每次從連接于園區網的PC上采集同一P2P-TV平臺的兩個頻道的兩段t時長的凈流量數據,其中兩次采集的兩個頻道相同;
步驟二、數據處理:對采集到的四段數據流進行協議過濾和端口過濾,保留主要UDP端口內的UDP數據,其中主要UDP端口是指t時長的采樣時間段內數據量最大的UDP端口;
步驟三、統計UDP數據中字節碼段的出現頻率:對于每一段數據流中所有數據包中的有效載荷數據前n個字節,分別統計長度為m字節的連續的字節碼段的出現頻率,其中m∈[4,l],4<l<n,對n-3個統計結果按照出現頻率由大到小進行排序;
步驟四、分析字節碼段,初步得出頻道特征碼:對于同一平臺的兩個頻道,分別從每個頻道的兩段不同的字節碼出現頻率統計結果中,找到字符完全匹配且出現頻率都比較大的字節碼段;兩個頻道對應的這兩個字節碼段如滿足以下條件:1)兩個字節碼段的長度相同;2)兩個字節碼段的內容不相同;3)兩個字節碼段的出現位置具有相同的規律;則初步設定這兩個字節碼段為對應頻道的特征碼;
步驟五、檢驗初步得出的頻道特征碼:使用同一平臺不同頻道不同時間段的數據檢驗兩個字節碼段的唯一性和恒定性,其中唯一性是指同一平臺其它頻道對應位置上的字節碼段互為不同,恒定性是指該字節碼段在大于6個月的時間段內不發生變化;不能通過檢驗則返回步驟四,通過檢驗則認為該字節碼段是該頻道的頻道特征碼;
步驟六、分析總結出頻道特征碼出現規律,包括頻道特征碼的包大小規律和位置規律,其中包大小規律是指特征碼主要出現在大小為多少的數據包;所述位置規律是指頻道特征碼主要出現在數據包中有效載荷數據中的哪個位置。
2.根據權利要求1所述P2P-TV頻道特征碼出現規律的提取方法,其特征是所述步驟一中,所述兩個不同的時間段取時間差為一天以上。
3.根據權利要求1所述P2P-TV頻道特征碼出現規律的提取方法,其特征是所述步驟四中,出現頻率都比較大的字節碼段指兩個字節碼段的出現頻率均位于出現頻率統計結果的前5位。
4.一種基于權利要求1所述P2P-TV頻道特征碼出現規律的提取方法的P2P-TV頻道識別方法,其特征是包括如下步驟:?
(一)頻道特征庫建立
步驟S101,設有K個P2P-TV平臺需要進行頻道識別,根據權利要求1所述P2P-TV頻道特征碼出現規律的提取方法分別找到K個平臺的頻道特征碼出現規律;
步驟S102,根據各平臺的頻道特征碼出現規律,提取K個平臺所有頻道的頻道特征碼;
步驟S103,根據所獲得的頻道特征碼建立頻道特征庫,頻道特征庫中各頻道特征碼至少包含以下信息:平臺號、頻道號和頻道特征碼;并根據具體情況對平臺和頻道進行編號;
(二)頻道識別過程
步驟S104,從園區網出口的交換機上采集網絡數據;
步驟S105,對采集到的網絡數據進行UDP協議過濾,僅留下UDP協議數據;
步驟S106,對過濾好的網絡數據流按照每個出現的(InnerIP,Port)進行網絡數據分流,得到細化到端口的子數據流,其中InnerIP為園區網內部IP地址;
步驟S107,子數據流中的數據包按(InnerIP,Port)匯聚成新的數據流;
步驟S108,從數據流中讀取短時間窗口Δt內的數據包;
步驟S109,K種P2P-TV平臺共對應K種特征碼出現規律,使用其中一種特征碼出現規律對短時間窗口Δt內的數據包進行頻道特征碼的提取;
步驟S110,將步驟S109提取的頻道特征碼和步驟S103得到的頻道特征庫中的頻道特征碼進行匹配,匹配失敗則進入步驟S111,匹配成功進入步驟S117;
步驟S111,判斷該短時間窗口內的數據包是否遍歷了K種平臺的特征碼提取規律,如果全部用過則進入步驟S112,如果沒有全部用過則返回步驟S109;
步驟S112,將Δt累加到T,其中T表示連續匹配失敗的時間累積長度,然后判斷T是否大于閾值M,其中M為判斷為未知流量的時間閾值,如所有T大于M,進入步驟S113,否則,進入步驟S114;
步驟S113,連續匹配失敗的時間累積長度T大于閾值M,判斷該數據流為未知數據流,并且退出識別過程;
步驟S114,該Δt時間段內的數據沒有匹配成功,且T小于閾值M,判定該數據流為需進一步識別的數據流,然后進入步驟S115;
步驟S115,判斷該數據流是否讀完,如果沒有讀完則返回步驟S108,數據讀完則進入步驟S116;
步驟S116,判斷未知識別流的判斷開關U是否等于零,未知識別流的判斷開關U對持續時間小于M同時又檢測不到頻道特征的數據流進行判斷,如果等于零則判斷該數據流?為未知數據流,并退出識別過程,否則直接退出識別過程;
步驟S117,特征碼匹配成功,返回識別結果,同時將連續匹配失敗的時間累積長度T置為零,并將未知識別的判斷開關U自加1,然后進入步驟S115。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010105437.3/1.html,轉載請聲明來源鉆瓜專利網。





