[發明專利]基于GBDT算法的攻擊識別方法及光伏并網接口裝置在審
| 申請號: | 201911342894.1 | 申請日: | 2019-12-23 |
| 公開(公告)號: | CN111144472A | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 吳海濤;徐成斌;賀生國;代尚林;陳銳;喬中偉;李偉華;梁洪浩;陳遠生;占捷文;王乾剛;朱小帆;丁凱;黃植煒;肖聲遠;何鴻雁;習偉;匡曉云;于楊;姚浩;簡淦楊;楊祎巍 | 申請(專利權)人: | 深圳供電局有限公司;長園深瑞繼保自動化有限公司;南方電網科學研究院有限責任公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;H02J3/38 |
| 代理公司: | 深圳市中知專利商標代理有限公司 44101 | 代理人: | 孫皓;顧楠楠 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 gbdt 算法 攻擊 識別 方法 并網 接口 裝置 | ||
1.一種基于GBDT算法的攻擊識別方法,其特征在于:包括如下步驟:
步驟一、獲取光伏并網接口裝置的信息數據流;
步驟二、對信息數據流進行預處理;
步驟三、將進行預處理后的信息數據流采用GBDT模型進行分類,輸出分類結果,所述分類包括正常類以及惡意攻擊類;
步驟四、當分類結果中存在攻擊類時,則根據攻擊類中數據的歸類發出相應的報警提示以及生成日志記錄進行保存同時還對信息數據流進行攔截;當分類結果均為正常類時,則對信息數據流進行轉發。
2.根據權利要求1所述的基于GBDT算法的攻擊識別方法,其特征在于:所述步驟四還包括將分類結果、報警提示和/或日志記錄發送至上層。
3.根據權利要求1所述的基于GBDT算法的攻擊識別方法,其特征在于:所述預處理包括特征提取、數值化以及歸一化處理。
4.根據權利要求1所述的基于GBDT算法的攻擊識別方法,其特征在于:所述步驟三將進行預處理后的信息數據流采用GBDT模型進行檢測前,先對GBDT模型進行分類訓練,得到已訓練好的GBDT分類模型,模型訓練包括如下步驟:
一、建立樣本集,所述樣本集包括正樣本以及負樣本,所以正樣本為正常的信息數據流,負樣本為受到惡意攻擊的信息數據流,所述惡意攻擊包括Dos攻擊,未授權訪問攻擊、接口端非正常探測、木馬病毒攻擊,運行狀態、氣象等消息偽造或篡改等攻擊類型的數據流;
二、輸入給定的訓練集T={(x1,y1),(x2,y2),…,(xn,yn)};迭代次數M;一個可微的損失函數yk={0,1},表示樣本x是否屬于第k類,1代表是,0代表否;pk(x)表示樣本x屬于第k類的概率;xi(i=1,2,…,n)為輸入樣本,yi(i=1,2,…,n)為輸入樣本xi對應的輸出值,也即分類標簽(表明該樣本是正常或何種攻擊類型的標簽);fk(x)為弱學習器,k=1,2,...,K,K表示共有分類的類別的總數:正常類,Dos攻擊,未授權訪問攻擊,接口端非正常探測,木馬病毒攻擊,消息篡改攻擊;
(1)根據樣本集(含正負樣本)中設定的標簽值yi,對弱學習器模型進行初始化:fk(x)=0,k=1,2,...,K(K為分類數,K=6);
(2)設置迭代次數m=1,2,…,M:
(2.1)計算樣本點屬于每個類別的概率:
其中,exp(fk(x))表示對fk(x)求指數;K為分類數目;
(2.2)對于每一個分類類型k=1,2,...,K:
(2.2.1)計算殘差:
rki=yki-Pk(xi),
其中,i=1,2,…,n為樣本數;yki為第i個樣本對應的第k類取值;Pk(xi)為樣本xi屬于k類的概率;
(2.2.2)以概率偽殘差{(x1,rk1),……,(xn,rkn)}重新訓練擬合一個分類樹;
(2.2.3)計算乘子:
其中,K為類別數;cmkj為m次迭代、第k類生成的樹的葉子節點乘子;Rmkj為m次迭代、第k類生成的樹的葉子節點區域;j=1,2,…,J為葉子節點數;m=1,2,…,M為迭代次數;xi(i=1,2,…,n)為輸入樣本;rki為第i個樣本第k類偽殘差;
(2.2.4)通過以下計算公式更新學習器:
其中,fk,m(x)為樣本x的m次迭代、第k類得到的學習器;fk,m-1(x)為樣本x的m-1次迭代、第k類得到的學習器;I為葉子特征的集合;Rmkj為m次迭代、第k類生成的樹的葉子節點區域,j=1,2,…,J為葉子節點數;
(3)輸出強分類器FMk(x):
其中,FMk(x)為樣本x的M次迭代、第k類得到的強分類器;cmkj為m次迭代、第k類生成的樹的葉子節點乘子;Rmkj為m次迭代、第k類生成的樹的葉子節點區域,j=1,2,…,J為葉子節點數;m=1,2,…,M為迭代次數;I為葉子特征的集合;
最后得到的FMk(x)用來得到第k類的相應的概率PMk(x):
將概率轉換為類別:
其中為最終的輸出類別,c(k,k')表示當真實值為k'時,預測為第k類時的聯合代價,即概率最大的類別即為預測的類別,最終得到已訓練好的GBDT模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳供電局有限公司;長園深瑞繼保自動化有限公司;南方電網科學研究院有限責任公司,未經深圳供電局有限公司;長園深瑞繼保自動化有限公司;南方電網科學研究院有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911342894.1/1.html,轉載請聲明來源鉆瓜專利網。





