[發(fā)明專利]一種基于杜鵑搜索算法的對等網絡流量特征選擇方法在審
| 申請?zhí)枺?/td> | 201410352930.3 | 申請日: | 2014-07-23 |
| 公開(公告)號: | CN104092618A | 公開(公告)日: | 2014-10-08 |
| 發(fā)明(設計)人: | 葉志偉;李沁沄;王明威;王春枝;劉偉;陳宏偉;徐慧;宗欣露;尹宇潔;喻東陽 | 申請(專利權)人: | 湖北工業(yè)大學 |
| 主分類號: | H04L12/801 | 分類號: | H04L12/801 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
| 地址: | 430068 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 杜鵑 搜索 算法 對等 網絡流量 特征 選擇 方法 | ||
技術領域
本發(fā)明屬于智能計算、計算機網絡和模式識別的交叉應用領域,涉及模式識別方法在計算機網絡,尤其涉及該技術在計算機網絡中對等網絡流量識別問題,具體涉及一種基于杜鵑搜索算法的對等網絡流量特征選擇方法。
背景技術
對等網絡技術是無中心服務器、依靠用戶群交換信息的互聯(lián)網體系,是互聯(lián)網技術的一個重要分支。與有傳統(tǒng)中心服務器的中央網絡系統(tǒng)不同,對等網絡的每個用戶端既是客戶機器也是服務器。目前對等網絡技術被廣泛應用于軍事、商業(yè)、政府信息、通訊等眾多領域。美國《財富》雜志稱對等網絡技術是改變互聯(lián)網發(fā)展的四大新技術之一。據(jù)統(tǒng)計對等網絡應用在互聯(lián)網應用占據(jù)80%左右的流量。在對等網絡快速發(fā)展的同時,由于對等網絡技術本身的特點,對等網絡應用對網絡運營商的網絡質量和用戶管理也帶來了巨大的危害。
為了使得對等網絡技術更好的為人們生產生活提供更好的服務,有必要對對等網絡流量的進行控制和管理,首先要解決的問題是對等網絡流量的識別。在對等網絡流量識別問題中,流量特征的提取和選擇對對等網絡流量識別有著重大的影響,單一的網絡流量特征通常識別精度不高,而過多的流量特征會增加流量樣本特征抽取的工作量;此外過多的特征會帶來維數(shù)災問題,增加分類器的計算時間,降低分類器的性能。所以為了提高對等網絡流量識別的正確率和減少計算工作量,在進行對等網絡流量分類識別之前,需要對原始的數(shù)據(jù)集進行特征選擇,剔除不相關或冗余的對等網絡流量特征,盡可能選擇出最能代表網絡流量樣本屬性的特征子集,以提高對等網絡流量識別的正確率。特征選擇也叫特征子集選擇,是指從已有的M個特征中選擇N(N小于等于M)個特征使得系統(tǒng)的特定指標最優(yōu)化。特征選擇是影響分類準確率的最重要的因素之一。實質上對等網絡流量特征選擇問題是一個計算時間復雜度為指數(shù)級別NP難求解問題,其時間復雜度為O(2M),M為原始特征個數(shù)。常用的求解算法如分支限界法,回溯法等只能求解規(guī)模很小的特征選擇問題。實際工作中,特征選擇問題常被視為組合優(yōu)化問題,采用啟發(fā)式算法或者最優(yōu)化方法獲得它的近似最優(yōu)解。
發(fā)明內容
杜鵑搜索算法是一種啟發(fā)式優(yōu)化算法,具有很強的全局尋優(yōu)能力,為了解決在對等網絡流量特征問題,本發(fā)明提出一種基于杜鵑搜索算法的對等網絡流量特征選擇方法。
本發(fā)明所采用的技術方案是:一種基于杜鵑搜索算法的對等網絡流量特征選擇方法,其特征在于,包括以下步驟:
步驟1:對獲取的網絡數(shù)據(jù)包進行預處理并提取網絡流量特征,對網絡流量特征進行歸一化處理,得到原始特征樣本集,所述的原始特征樣本集作為輸入數(shù)據(jù)集;
步驟2:將輸入數(shù)據(jù)集作為完整的特征空間輸入到特征選擇算法中;
步驟3:初始化杜鵑搜索算法所需的參數(shù),得到算法的初始種群;
步驟4:將杜鵑搜索算法中鳥巢的初始空間位置向量解碼成相應的特征子集,利用適應度評價函數(shù)計算得到每個特征子集的適應度函數(shù)值,比較每個鳥巢的適應度函數(shù)值,并記錄和保留當前最優(yōu)鳥巢位置為A;
步驟5:通過杜鵑搜索算法中的位置更新公式更新鳥巢的位置,得到一組新解并計算其適應度函數(shù)值,比較這組解的適應度函數(shù)值并記其具有最優(yōu)適應度函數(shù)值的位置為B;
步驟6:用隨機數(shù)r∈[0,1]與鳥巢的主人發(fā)現(xiàn)外來的鳥蛋概率pa對比,并判斷:
若r>pa,則通過列維飛行隨機改變鳥巢位置,得到一組新的鳥巢位置,并計算其適應度函數(shù)值,比較這組解的適應度函數(shù)值并記其具有最優(yōu)適應度函數(shù)值的位置為C;
若r≤pa,則順序執(zhí)行下述步驟7;
步驟7:將位置B和C的適應度函數(shù)值與上一代當前最優(yōu)鳥巢位置A的適應度函數(shù)值進行對比,若更好,則將其作為當前的最優(yōu)鳥巢位置A;
步驟8:判斷,是否滿足終止條件?
若否,則回轉執(zhí)行所述的步驟5;
若是,則解碼并輸出全局最優(yōu)鳥巢位置對應的最優(yōu)特征子集。
作為優(yōu)選,步驟1中所述的對獲取的網絡流量包進行預處理,其具體實現(xiàn)過程是利用網絡抓包工具分時段隨機抓取一定數(shù)量網絡數(shù)據(jù)包并存入樣本數(shù)據(jù)庫中,人工分析出其中對等網絡包和普通網絡包的數(shù)量,對抓取的網絡數(shù)據(jù)包提取網絡流量特征。
作為優(yōu)選,步驟1中所述的對對網絡流量特征進行歸一化處理,采用的公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業(yè)大學,未經湖北工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410352930.3/2.html,轉載請聲明來源鉆瓜專利網。





