[發(fā)明專(zhuān)利]非結(jié)構(gòu)化文本中提取漏洞信息的方法在審
| 申請(qǐng)?zhí)枺?/td> | 201610857283.0 | 申請(qǐng)日: | 2016-09-27 |
| 公開(kāi)(公告)號(hào): | CN107871078A | 公開(kāi)(公告)日: | 2018-04-03 |
| 發(fā)明(設(shè)計(jì))人: | 達(dá)小文;毛俐旻;吳明杰;溫泉;常承偉;陳志浩;謝梅 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京計(jì)算機(jī)技術(shù)及應(yīng)用研究所 |
| 主分類(lèi)號(hào): | G06F21/56 | 分類(lèi)號(hào): | G06F21/56 |
| 代理公司: | 中國(guó)兵器工業(yè)集團(tuán)公司專(zhuān)利中心11011 | 代理人: | 張然 |
| 地址: | 100854*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 結(jié)構(gòu) 文本 提取 漏洞 信息 方法 | ||
1.一種非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,包括:
建立漏洞領(lǐng)域概念表,漏洞領(lǐng)域概念表包括漏洞相關(guān)的詞匯;
獲取漏洞信息文本;
提取漏洞信息文本中的詞匯,將其與漏洞領(lǐng)域概念表進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)構(gòu)獲取漏洞信息。
2.如權(quán)利要求1所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,包括:對(duì)文本進(jìn)行分詞處理,得到若干個(gè)詞匯,然后將詞匯依次與漏洞領(lǐng)域概念進(jìn)行比對(duì),當(dāng)發(fā)現(xiàn)多個(gè)與漏洞領(lǐng)域概念相近的詞匯時(shí),就認(rèn)為該文本段描述的內(nèi)容與漏洞有關(guān)。
3.如權(quán)利要求2所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,得到英語(yǔ)詞匯的方法包括:按照空格及標(biāo)點(diǎn)符號(hào)分詞,當(dāng)碰到一個(gè)空格或標(biāo)點(diǎn)符號(hào)就分出一個(gè)詞;忽略對(duì)文本的特征沒(méi)有實(shí)質(zhì)性的影響的修飾詞。
4.如權(quán)利要求2所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,得到中文詞匯的方法包括:將混雜的英文直接分離出來(lái),分離出來(lái)的部分用空字符代替;通過(guò)中文詞匯庫(kù)依次向后查詢(xún),選取首部?jī)蓚€(gè)字作為一個(gè)詞匯,若中文詞匯庫(kù)中存在此詞匯,則將其作為分詞記錄下來(lái),并嘗試向后推移一個(gè)字,若還是一個(gè)有意義的詞匯,則繼續(xù)往后推移,直到推移多個(gè)字組成的詞匯在中文詞匯庫(kù)中查詢(xún)不到時(shí),將最長(zhǎng)的詞匯作為一個(gè)分詞取出。
5.如權(quán)利要求2所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,還包括:
建立一個(gè)句式庫(kù),該句式庫(kù)包含英文和中文的漏洞相關(guān)的常用句式;
將得到的詞匯的所對(duì)應(yīng)的語(yǔ)句與句式庫(kù)中的語(yǔ)句進(jìn)行匹配,如匹配成功,則根據(jù)句式查找其他漏洞屬性。
6.如權(quán)利要求2所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,包括:將一段文本當(dāng)作一個(gè)字符串,將事先構(gòu)建好的漏洞領(lǐng)域概念依次與文本字符串進(jìn)行匹配,若發(fā)現(xiàn)與漏洞領(lǐng)域概念意思相近的詞匯就進(jìn)行提取,并記錄該詞匯在原始文本中的位置,當(dāng)提取一定數(shù)量的詞匯時(shí),就認(rèn)為該段文本描述的為漏洞有關(guān)信息。
7.如權(quán)利要求6所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,還包括:
建立一個(gè)句式庫(kù),該句式庫(kù)包含英文和中文常用句式;
將詞匯的所對(duì)應(yīng)的語(yǔ)句與句式庫(kù)中的語(yǔ)句進(jìn)行匹配,如匹配成功,則根據(jù)句式查找其他漏洞屬性。
8.如權(quán)利要求1所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,還包括:獲取漏洞信息后,最后將提取的所有漏洞信息按照漏洞屬性存儲(chǔ)到數(shù)據(jù)庫(kù)中。
9.如權(quán)利要求2所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,獲取漏洞信息文本包括:安全公司網(wǎng)站、廠商網(wǎng)站、安全論壇和安全研究員博客的網(wǎng)站的URL,通過(guò)HTML解析各URL對(duì)應(yīng)的網(wǎng)頁(yè),過(guò)濾其中的圖片及樣式,提取頁(yè)面中的所有文本段落信息。
10.如權(quán)利要求所述的非結(jié)構(gòu)化文本中提取漏洞信息的方法,其特征在于,提取漏洞信息文本中的詞匯后,還將查找提取的詞匯的所對(duì)應(yīng)的語(yǔ)句,分析語(yǔ)句的句式,根據(jù)句式查找漏洞信息。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京計(jì)算機(jī)技術(shù)及應(yīng)用研究所,未經(jīng)北京計(jì)算機(jī)技術(shù)及應(yīng)用研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610857283.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤(pán)或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 網(wǎng)站漏洞告警方法及裝置
- 網(wǎng)站漏洞審核方法及裝置
- 漏洞檢測(cè)方法及裝置、信息交互方法及設(shè)備
- 一種基于漏洞關(guān)聯(lián)分布模型的漏洞發(fā)現(xiàn)方法
- 漏洞庫(kù)構(gòu)建方法、裝置、漏洞庫(kù)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 漏洞快速感知、定位及驗(yàn)證的方法與系統(tǒng)
- 一種基于Oval的漏洞掃描修復(fù)系統(tǒng)及方法
- 一種漏洞驗(yàn)證的方法及電子設(shè)備
- 一種漏洞防護(hù)方法、裝置及電子設(shè)備
- 漏洞數(shù)據(jù)的比較方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)





