[發(fā)明專利]一種基于文本深度學習的軟件安全漏洞預測方法在審
| 申請?zhí)枺?/td> | 201810353774.0 | 申請日: | 2018-04-19 |
| 公開(公告)號: | CN108549817A | 公開(公告)日: | 2018-09-18 |
| 發(fā)明(設計)人: | 危勝軍;鐘浩;單純;胡昌振;牛中盈 | 申請(專利權)人: | 北京理工大學;北京計算機技術及應用研究所 |
| 主分類號: | G06F21/57 | 分類號: | G06F21/57;G06F17/30;G06F17/27 |
| 代理公司: | 北京理工大學專利中心 11120 | 代理人: | 高燕燕 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 軟件安全漏洞 神經網絡模型 軟件源代碼 預測 文本 分類器 學習 源代碼 機器學習算法 結構性特征 安全漏洞 軟件模塊 文本特征 學習軟件 訓練調整 預測模型 漏洞 淺層 | ||
1.一種基于文本深度學習的軟件安全漏洞預測方法,其特征在于,針對軟件的源代碼,以其中的軟件模塊為處理單元,統計每個單詞在源代碼文本中出現頻率,將單詞及單詞出現的頻率作為該源代碼文本的特征向量,該特征向量作為基于深度神經網絡結構的特征學習器的輸入,特征學習器對其進行學習得到特征向量的結構性特征,該結構性特征作為分類器的輸入,對分類器的參數進行訓練調整,獲得最優(yōu)的漏洞預測模型,用于該軟件的新的軟件模塊的漏洞預測。
2.如權利要求1所述的一種基于文本深度學習的軟件安全漏洞預測方法,其特征在于,所述特征向量采用以下方式提取:以預測對象中的軟件模塊為處理單元,首先對源代碼文本中出現的標點符號以及代碼注釋進行剔除,對剩下的文本以空格作為分隔符將每個單詞進行提取,并統計每個單詞在整個文本中出現的次數,最后將出現次數進行歸一化處理,處理的結果即是單詞出現的頻率,由此得到針對該源代碼文本的特征向量。
3.如權利要求1或2所述的一種基于文本深度學習的軟件安全漏洞預測方法,其特征在于,源代碼文本的特征向量采用如下表示形式:
Com ponentN am e:(Item_1:N um ber_1;Item_2:N um ber_2;;…;Item_n:Num ber_n)
其中,Com ponentN ame表示該模塊的名稱,Item_1表示第1個單詞的名稱,N umber_1表示第1個單詞出現的頻率,Item_2表示第2個單詞的名稱,N um ber_2表示第2個單詞出現的頻率,此次類推,Item_n表示第n個單詞的名稱,N um ber_n表示第n個單詞出現的頻率。
4.如權利要求1或2所述的一種基于文本深度學習的軟件安全漏洞預測方法,其特征在于,所述分類器采用淺層機器學習算法。
5.如權利要求4所述的一種基于文本深度學習的軟件安全漏洞預測方法,其特征在于,所述分類器的輸出為二分類,即所預測對象的模塊是否具有漏洞。
6.如權利要求1或2所述的一種基于文本深度學習的軟件安全漏洞預測方法,其特征在于,該方法進一步包括,針對預測對象使用不同的深度神經網絡模型和不同的分類器算法建立多種漏洞預測模型,對比性能指標值,確定最優(yōu)的漏洞預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學;北京計算機技術及應用研究所,未經北京理工大學;北京計算機技術及應用研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810353774.0/1.html,轉載請聲明來源鉆瓜專利網。





