[發明專利]基于改進的SVM-KNN算法的半監督托攻擊檢測方法在審
| 申請號: | 201711416340.2 | 申請日: | 2017-12-25 |
| 公開(公告)號: | CN108154178A | 公開(公告)日: | 2018-06-12 |
| 發明(設計)人: | 沈琦;牛立坤 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;H04L29/06 |
| 代理公司: | 北京匯信合知識產權代理有限公司 11335 | 代理人: | 夏靜潔 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 攻擊檢測 標記用戶 用戶數據 半監督 分類器 算法 改進 二次分類 分類結果 正常用戶 相似度 訓練集 分類 檢測 判定 輸出 更新 | ||
1.一種基于改進的SVM-KNN算法的半監督托攻擊檢測方法,其特征在于,包括:
將用戶集合分為已標記用戶集和未標記用戶集,將已標記用戶集作為訓練集訓練出初始SVM分類器;
利用初始SVM分類器對未標記用戶集中的任一樣本用戶進行初步分類;
將初步分類中標記為正常用戶的用戶數據并入所述訓練集中,將其余的用戶數據并入分類邊界附近向量集中;
以改進的KNN相似度公式(1)作為KNN算法的距離公式,構成SVM-KNN分類器對所述分類邊界附近向量集中的用戶進行二次分類,
其中,余弦相似度加入權重值后的余弦相似度共同特征項數目占總特征項數目的比例參數a+b+c=1,xi、dl為樣本的特征向量,qjk為特征項tk的權重值,wik和wjk(1≤k≤p)分別為樣本di和dj中第k個特征項的權重,xik,wjk(1≤k≤p)為第k維上的坐標,p為特征項數目,為類中心向量的權重;
將KNN算法分類得到的標記用戶數據并入所述訓練集中,并利用更新后的所述訓練集重新訓練新的SVM分類器;
判斷分類結果是否達到最佳檢測性能,若判定是,則輸出最終分類器,否則循環對所述未標記用戶集中的用戶進行分類;
利用所述最終分類器對用戶數據進行托攻擊檢測。
2.根據權利要求1所述的基于改進的SVM-KNN算法的半監督托攻擊檢測方法,其特征在于,所述利用初始SVM分類器對未標記用戶集中的任一樣本用戶進行初步分類具體包括:
在所述未標記用戶集中任選一樣本用戶,利用SVM計算公式(2)計算出分類決策函數f(x)的值;
判斷所述分類決策函數的絕對值|f(x)|是否大于給定的分類閾值ε(0<ε<1);
若判定為是,則將所述樣本標記為正常用戶。
3.根據權利要求1所述的基于改進的SVM-KNN算法的半監督托攻擊檢測方法,其特征在于,所述以改進的KNN相似度公式(1)作為KNN算法的距離公式,對所述分類邊界附近向量集中的用戶進行二次分類具體包括:
將所述訓練集中的用戶數據和所述分類邊界附近向量集中的待分類樣本用戶數據進行一致的向量化;
利用所述距離公式計算待分類樣本與所述訓練集中每一個樣本的距離,并選擇距離最近的k個樣本作為所述待分類樣本的最近鄰;
依次計算最近鄰中每個樣本屬于不同分類的權重值;
比較某一樣本屬于不同分類的權重值的大小,并將該樣本劃分為權重值最大的分類中。
4.根據權利要求3所述的基于改進的SVM-KNN算法的半監督托攻擊檢測方法,其特征在于,某一樣本屬于每一分類的cj的權重向量為qj,qj=(qj1,qj2,...,qjp),其中qj1+qj2+...+qjp=1,權重值qjk為特征項tk對應的權重,權重值的大小表示tk在不同分類中的重要程度。
5.根據權利要求1所述的基于改進的SVM-KNN算法的半監督托攻擊檢測方法,其特征在于,所述判斷分類結果是否達到最佳檢測性能,若判定是,則輸出最終分類器,否則循環對所述未標記用戶集中的用戶進行分類具體包括:
根據分類結果,計算分類過程的準確率和查全率,其中,所述分類結果包括真正、真負、假正和假負四種數據,所述真正和真負分別為正確判定為攻擊用戶和真實用戶的數據,所述假正和假負為錯誤判定為攻擊用戶和真實用戶的數據,所述準確率的計算公式為:準確率=真正/(真正+假正),所述查全率的計算公式為:查全率=真正/(真正+假負);
判斷所述準確率和所述查全率是否均達到預設的最佳閾值;
若所述準確率和查全率均達到預設的最佳閾值,則將獲得所述分類結果的SVM-KNN分類器作為最終分類器輸出,否則循環對所述未標記用戶集中的用戶進行分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711416340.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:業務識別方法、裝置、終端設備及存儲介質
- 下一篇:一種數據的檢錯方法及系統





