[發明專利]一種涉密載體風險分析方法及系統有效
| 申請號: | 202011374168.0 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112487475B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 高希敏;張甲弟;閆立平;翟彥超;李靜;焦永陽;何川;林曉婷 | 申請(專利權)人: | 北京京航計算通訊研究所 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F18/214;G06F18/2431 |
| 代理公司: | 北京天達知識產權代理事務所有限公司 11386 | 代理人: | 龔頤雯 |
| 地址: | 100074 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 載體 風險 分析 方法 系統 | ||
1.一種涉密載體風險分析方法,其特征在于,包括以下步驟:
基于獲取的樣本涉密載體屬性信息數據集,利用權值分類結合決策樹建立風險預測模型;
利用所述風險預測模型對待檢測涉密載體進行檢測,獲得風險值及風險屬性頻率值,包括:將待檢測涉密載體的屬性信息導入風險預測模型,獲得所述風險預測模型中每一決策樹的輸出值;根據每一決策樹的輸出值及權值獲得風險預測模型輸出的風險值;統計風險判定結果為有風險的所有決策樹中每一屬性信息的出現次數,將該次數作為屬性頻率值,并進行降序排序,取前預設個數的屬性頻率值對應的屬性信息作為風險屬性,對應的屬性頻率值作為風險屬性頻率值;
將所述風險值及風險屬性頻率值進行圖形化展示。
2.根據權利要求1所述的涉密載體風險分析方法,其特征在于,所述基于獲取的樣本涉密載體屬性信息數據集,利用權值分類結合決策樹建立風險預測模型的步驟,包括:
獲取所述樣本涉密載體屬性信息數據集,所述數據集中包含N個涉密載體屬性信息數據樣本;
執行重復訓練過程,以獲得多個決策樹,所述重復訓練過程包括:從所述數據集中有放回的抽取N個樣本組成樣本訓練集;利用所述樣本訓練集構建決策樹;
根據訓練獲得的每一決策樹的準確率為每一所述決策樹分配權值,進而獲得風險預測模型。
3.根據權利要求2所述的涉密載體風險分析方法,其特征在于,所述利用所述樣本訓練集構建決策樹的步驟,包括:
從所述樣本訓練集的樣本中均隨機選取預設個數的屬性信息,所述預設個數小于每一所述樣本中屬性信息的數量;
基于選取的所述屬性信息以及樣本訓練集,利用ID3算法構建獲得決策樹。
4.根據權利要求2所述的涉密載體風險分析方法,其特征在于,所述根據訓練獲得的每一決策樹的準確率為每一所述決策樹分配權值,進而獲得風險預測模型的步驟,包括:
利用數據集中樣本訓練集的補集對相應的決策樹進行測試,獲得所述決策樹的準確率;
遍歷每一所述決策樹,獲得每一決策樹的準確率;
以決策樹的準確率作為所述決策樹的權值,進而獲得風險預測模型。
5.根據權利要求1所述的涉密載體風險分析方法,其特征在于,具體包括:
所述決策樹的風險判定結果為有風險時,其對應的風險值為:
ri=di,
所述決策樹的風險判定結果為無風險時,其對應的風險值為:
ri=1-di,
所述風險預測模型輸出的風險值r為:
其中,ri表示決策樹的風險值,di表示所述決策樹對應的權值,i=1、2、3...n,n表示所述風險預測模型中的決策樹的數量。
6.根據權利要求1-5任一項所述的涉密載體風險分析方法,其特征在于,所述屬性信息包括,涉密載體的歸屬、狀態或時間,所述歸屬包括涉密載體責任部門或責任人,所述狀態包括留用、外發或銷毀,所述時間包括制作時間或留存超期時間。
7.一種涉密載體風險分析系統,其特征在于,包括:
模型建立模塊,用于基于獲取的樣本涉密載體屬性信息數據集,利用權值分類結合決策樹建立風險預測模型;
風險預測模塊,用于利用所述風險預測模型對待檢測涉密載體進行檢測,獲得風險值及風險屬性頻率值,包括:將待檢測涉密載體的屬性信息導入風險預測模型,獲得所述風險預測模型中每一決策樹的輸出值;根據每一決策樹的輸出值及權值獲得風險預測模型輸出的風險值;
統計風險判定結果為有風險的所有決策樹中每一屬性信息的出現次數,將該次數作為屬性頻率值,并進行降序排序,取前預設個數的屬性頻率值對應的屬性信息作為風險屬性,對應的屬性頻率值作為風險屬性頻率值;
展示模塊,用于將所述風險值及風險屬性頻率值進行圖形化展示。
8.根據權利要求7所述的涉密載體風險分析系統,其特征在于,所述模型建立模塊,還用于:
獲取所述樣本涉密載體屬性信息數據集,所述數據集中包含N個涉密載體屬性信息數據樣本;
執行重復訓練過程,以獲得多個決策樹,所述重復訓練過程包括:從所述數據集中有放回的抽取N個樣本組成樣本訓練集;利用所述樣本訓練集構建決策樹;
根據訓練獲得的每一決策樹的準確率為每一所述決策樹分配權值,進而獲得風險預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京航計算通訊研究所,未經北京京航計算通訊研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011374168.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種互聯網風險信息的監測方法及裝置
- 下一篇:一種停電預警信號校驗方法及系統





