[發(fā)明專利]漏洞分類方法、裝置、設(shè)備及介質(zhì)在審

申請?zhí)枺?/td>	202111381657.3	申請日：	2021-11-17
公開（公告）號：	CN114117445A	公開（公告）日：	2022-03-01
發(fā)明（設(shè)計(jì)）人：	鄭天文;王竟成;王輝;林承軍	申請（專利權(quán)）人：	中國工商銀行股份有限公司
主分類號：	G06F21/57	分類號：	G06F21/57;G06K9/62
代理公司：	中科專利商標(biāo)代理有限責(zé)任公司 11021	代理人：	趙婷
地址：	100140 北***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	漏洞分類方法裝置設(shè)備介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本公開提供了一種漏洞分類方法、裝置、設(shè)備、存儲介質(zhì)和程序產(chǎn)品，用于識別補(bǔ)丁文件修復(fù)的漏洞類型，可以應(yīng)用于人工智能技術(shù)領(lǐng)域。該漏洞分類方法包括：獲取待識別的第一補(bǔ)丁文件；按照預(yù)處理規(guī)則提取所述第一補(bǔ)丁文件中的第一更新代碼片段；按照預(yù)定的向量轉(zhuǎn)換規(guī)則將所述第一更新代碼片段中的代碼處理為第一向量；以及以所述第一向量作為預(yù)訓(xùn)練好的漏洞分類模型的輸入，基于所述漏洞分類模型輸出的漏洞分類結(jié)果，確定所述第一補(bǔ)丁文件所修復(fù)的漏洞類型。本公開還提供了一種訓(xùn)練漏洞分類模型的方法、裝置、設(shè)備、存儲介質(zhì)和程序產(chǎn)品。

技術(shù)領(lǐng)域

本公開涉及人工智能領(lǐng)域，更具體地涉及一種用于識別補(bǔ)丁文件修復(fù)的漏洞類型的漏洞分類方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。

背景技術(shù)

漏洞分類是進(jìn)行漏洞管理的基礎(chǔ)。目前的漏洞管理普遍依賴公共漏洞數(shù)據(jù)庫(例如，國際安全組織維護(hù)的公共漏洞數(shù)據(jù)庫)中的數(shù)據(jù)，例如，通過對公共漏洞數(shù)據(jù)庫中的漏洞數(shù)據(jù)的統(tǒng)計(jì)、分析或?qū)W習(xí)，可以掌握當(dāng)前出現(xiàn)的各種類型漏洞的分布、每種漏洞的特點(diǎn)、或者學(xué)習(xí)漏洞代碼的特點(diǎn)以幫助發(fā)現(xiàn)程序代碼中是否有漏洞等。然而公共漏洞數(shù)據(jù)庫中的漏洞數(shù)據(jù)的錄入和維護(hù)成本較高，而且漏洞數(shù)據(jù)從收錄到公開有一定的周期，并且公共漏洞數(shù)據(jù)庫中收錄的數(shù)據(jù)的范圍受限于數(shù)據(jù)庫維護(hù)方的選擇或權(quán)限，數(shù)據(jù)范圍比較局限，從而會(huì)導(dǎo)致可供分析使用的漏洞數(shù)據(jù)集具有滯后性、數(shù)據(jù)不充分等問題。

發(fā)明內(nèi)容

鑒于上述問題，本公開實(shí)施例提供了一種漏洞分類方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品，以及訓(xùn)練漏洞分類模型的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品，可以提高可供分析使用的漏洞數(shù)據(jù)集的實(shí)時(shí)性，擴(kuò)大可學(xué)習(xí)的漏洞數(shù)據(jù)集的數(shù)據(jù)范圍。

本公開實(shí)施例的第一方面，提供了一種漏洞分類方法。所述漏洞分類方法用于識別補(bǔ)丁文件修復(fù)的漏洞類型。所述方法包括：獲取待識別的第一補(bǔ)丁文件；按照預(yù)處理規(guī)則提取所述第一補(bǔ)丁文件中的第一更新代碼片段，其中，所述第一更新代碼片段是基于所述第一補(bǔ)丁文件相比于其所修復(fù)的原代碼文件發(fā)生變化的代碼得到的；按照預(yù)定的向量轉(zhuǎn)換規(guī)則將所述第一更新代碼片段中的代碼處理為第一向量；以及以所述第一向量作為預(yù)訓(xùn)練好的漏洞分類模型的輸入，基于所述漏洞分類模型輸出的漏洞分類結(jié)果，確定所述第一補(bǔ)丁文件所修復(fù)的漏洞類型。

根據(jù)本公開的實(shí)施例，所述按照預(yù)處理規(guī)則提取所述第一補(bǔ)丁文件中的第一更新代碼片段包括：從所述第一補(bǔ)丁文件中，刪除相比于其所修復(fù)的原代碼文件發(fā)生變化的更改行以外的文本行，以保留所述更改行中的代碼；以及對所述更改行中的代碼進(jìn)行規(guī)范化處理，得到所述第一更新代碼片段。

根據(jù)本公開的實(shí)施例，所述按照預(yù)定的向量轉(zhuǎn)換規(guī)則將所述第一更新代碼片段中的代碼處理為第一向量包括：基于所述第一更新代碼片段中的詞序列，得到第一字典變量；以及按照預(yù)定義的映射函數(shù)中每個(gè)詞的索引值，將所述第一字典變量中的每個(gè)詞轉(zhuǎn)換為對應(yīng)的索引值，以生成所述第一向量。

根據(jù)本公開的實(shí)施例，所述映射函數(shù)是對訓(xùn)練所述漏洞分類模型所使用的數(shù)據(jù)集中的詞生成索引值而得到的。

根據(jù)本公開的實(shí)施例，所述漏洞分類模型是通過如下方式訓(xùn)練得到的：獲取已知修復(fù)的漏洞類型的N個(gè)第二補(bǔ)丁文件，其中，N為大于或等于1的整數(shù)；按照所述預(yù)處理規(guī)則提取每個(gè)所述第二補(bǔ)丁文件中的第二更新代碼片段，其中，所述第二更新代碼片段是基于所述第二補(bǔ)丁文件相比于其所修復(fù)的原代碼文件發(fā)生變化的代碼得到的；按照所述向量轉(zhuǎn)換規(guī)則將所述第二更新代碼片段中的代碼處理為第二向量；以每個(gè)所述第二補(bǔ)丁文件對應(yīng)的漏洞類型的信息作為所述第二補(bǔ)丁文件對應(yīng)的所述第二向量的標(biāo)簽，得一個(gè)樣本數(shù)據(jù)；其中，N個(gè)所述第二補(bǔ)丁文件對應(yīng)得到N個(gè)所述樣本數(shù)據(jù)；以及利用N個(gè)所述樣本數(shù)據(jù)組成的數(shù)據(jù)集，訓(xùn)練所述漏洞分類模型。

根據(jù)本公開的實(shí)施例，所述漏洞分類模型包括BERT模型。

根據(jù)本公開的實(shí)施例，所述漏洞分類模型輸出的漏洞分類結(jié)果用于表示以下任意一種漏洞類型：未修復(fù)漏洞、權(quán)限驗(yàn)證漏洞、代碼注入漏洞、跨站腳本攻擊漏洞、溢出漏洞、信息泄露漏洞或輸入校驗(yàn)漏洞。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國工商銀行股份有限公司，未經(jīng)中國工商銀行股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202111381657.3/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：立式水性漆回轉(zhuǎn)噴涂裝置
下一篇：一種光纖編碼復(fù)刻與測量一體化系統(tǒng)

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備，如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程

免登錄下載普通用戶下載升級VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】