[發明專利]智能系統安全體系態勢感知構架中采集樣本的平衡方法在審
| 申請號: | 201911047187.X | 申請日: | 2019-10-30 |
| 公開(公告)號: | CN110929761A | 公開(公告)日: | 2020-03-27 |
| 發明(設計)人: | 李千目;董瀟 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 薛云燕 |
| 地址: | 210094 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 系統安全 體系 態勢 感知 構架 采集 樣本 平衡 方法 | ||
本發明公開了一種智能系統安全體系態勢感知構架中采集樣本的平衡方法。該方法包括以下步驟:智能系統安全體系態勢感知構架進行數據采集得到不平衡樣本,利用徑向基核函數對不平衡樣本中的正類樣本進行訓練,得到最優的邊界參數;在正類樣本中進行邊界選擇,剔除正類樣本中的噪聲數據;使用譜聚類對無噪聲數據進行聚類,得到適用于smote算法的k個聚類樣本;利用smote算法進行樣本生成,完成采集樣本的平衡。本發明解決了采集樣本中的正負比例失衡問題,提高了機器學習中常用模型在不平衡樣本下的預測準確率。
技術領域
本發明涉及安全數據挖掘中樣本平衡技術領域,特別是一種智能系統安全體系態勢感知構架中采集樣本的平衡方法。
背景技術
傳統的智能系統安全體系態勢感知構架采集的數據當中,采集的正常數據與異常數據的比例通常是不均衡的。而在分類問題中,通常需要數據樣本為平衡樣本,即正負樣本的比例為1:1。在極不平衡樣本的條件下,傳統的線性模型在智能系統安全體系態勢感知問題方面預測準確度較低,預測結果會偏向樣本類多的一方。在分類領域出現的大多數成熟的分類算法對于不平衡樣本都是比較敏感的,因此對于如何進行樣本的平衡是所有不平衡樣本分類問題均應解決的首要問題。
現有的對于不平衡樣本問題,通常的解決方法是在數據層面上或者算法層面上來進行的。算法層面處理方法是增加小樣本錯誤分類的懲罰代價,并將此代價直接體現在目標函數里,屬于代價敏感的方法,這種方法可以通過優化目標函數調整模型在小樣本上的注意力。數據層面處理方法多借助數據采樣法使整體訓練集樣本趨于平衡,即各類樣本數基本一致。隨著樣本平衡問題的提出以及眾多學者在數據層樣本處理研究的不斷深入,為了更好地對樣本進行均衡處理,大多數研究均采用欠采樣(undersampling)方法和欠采樣進行樣本均衡。但普通欠采樣會丟失大量信息,過采樣因為存在噪聲點而使得生成的數據脫離了實際生活,將噪聲進行了放大。
發明內容
本發明的目的在于提供一種能夠解決不平衡樣本分類問題中的正負比例失衡問題,提高機器學習中常用模型在不平衡樣本下的智能系統安全體系態勢感知構架中采集樣本的平衡方法。
實現本發明目的的技術解決方案為:一種智能系統安全體系態勢感知構架中采集樣本的平衡方法,包括以下步驟:
步驟1,智能系統安全體系態勢感知構架進行數據采集得到不平衡樣本,利用徑向基核函數對不平衡樣本中的正類樣本進行訓練,得到最優的邊界參數;
步驟2,在正類樣本中進行邊界選擇,剔除正類樣本中的噪聲數據;
步驟3,使用譜聚類對無噪聲數據進行聚類,得到適用于smote算法的k個聚類樣本;
步驟4,利用smote算法進行樣本生成,完成采集樣本的平衡。
進一步地,步驟1所述的利用徑向基核函數對不平衡樣本中的正類樣本進行訓練,得到最優的邊界參數,具體如下:
步驟1.1、分解出不平衡樣本中的正類樣本Dmin;
步驟1.2、利用徑向基核函數進行正類樣本訓練,并利用機器學習模型進行樣本精確度分析,得到最優的樣本邊界參數,其中徑向基核函數為:
其中,σ為徑向基核函數的超參數,也是訓練邊界的參數,定義參數的范圍為0~1,利用步長為0.1對σ進行網格搜索;r=||x1-x2||,其中x1為空間任意一點,x2為選取的一個中心點,r為求得的歐氏距離;通過進行正類樣本模型預測,得到最優的樣本邊界參數;
正類樣本通過徑向基核函數映射到特征空間H:k(x,y)=(Φ(x)·Φ(y)),其中x、y為特征空間下的兩個數據樣本,Φ為將低維映射到高維的核映射,k(x,y)為在高維下兩個樣本x,y的內積。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911047187.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:生產鋼筋籠的成套設備
- 下一篇:一種應用于硫酸鎂晶體包裝的設備





