[發(fā)明專利]惡意網(wǎng)址的分類方法、裝置、計(jì)算機(jī)設(shè)備和可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011027013.X | 申請(qǐng)日: | 2020-09-25 |
| 公開(公告)號(hào): | CN112115266A | 公開(公告)日: | 2020-12-22 |
| 發(fā)明(設(shè)計(jì))人: | 陳勁 | 申請(qǐng)(專利權(quán))人: | 奇安信科技集團(tuán)股份有限公司;網(wǎng)神信息技術(shù)(北京)股份有限公司 |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06F16/906 |
| 代理公司: | 北京英特普羅知識(shí)產(chǎn)權(quán)代理有限公司 11015 | 代理人: | 程超 |
| 地址: | 100088 北京市西城區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 惡意 網(wǎng)址 分類 方法 裝置 計(jì)算機(jī) 設(shè)備 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提供了一種惡意網(wǎng)址的分類方法、裝置、計(jì)算機(jī)設(shè)備和可讀存儲(chǔ)介質(zhì)。該惡意網(wǎng)址的分類方法包括:獲取目標(biāo)網(wǎng)址對(duì)應(yīng)的網(wǎng)絡(luò)資源;提取網(wǎng)絡(luò)資源中的靜態(tài)資源和動(dòng)態(tài)資源;通過(guò)預(yù)設(shè)的第一分類模型分類靜態(tài)資源,以得到目標(biāo)網(wǎng)址對(duì)應(yīng)的第一分類信息;通過(guò)預(yù)設(shè)的第二分類模型分類動(dòng)態(tài)資源,以得到目標(biāo)網(wǎng)址對(duì)應(yīng)的第二分類信息;以及根據(jù)第一分類信息和第二分類信息確定目標(biāo)網(wǎng)址所屬的惡意網(wǎng)址類別。通過(guò)本發(fā)明,能夠提升分類準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能和網(wǎng)絡(luò)安全技術(shù)領(lǐng)域,尤其涉及一種惡意網(wǎng)址的分類方法、裝置、計(jì)算機(jī)設(shè)備和可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
域名、ip、URL等均對(duì)應(yīng)互聯(lián)網(wǎng)中不同的網(wǎng)絡(luò)資源,為了鑒定其中的不安全資源,傳統(tǒng)做法是對(duì)該網(wǎng)絡(luò)資源進(jìn)行爬蟲抓取后,根據(jù)其網(wǎng)絡(luò)資源中的ip地域、域名后綴以及爬取到的文本或源碼片段等,依賴人工經(jīng)驗(yàn)制定人工規(guī)則,通過(guò)規(guī)則來(lái)識(shí)別和分類惡意網(wǎng)址。
而基于人工規(guī)則的分類引擎,對(duì)人工經(jīng)驗(yàn)的依賴大,分類準(zhǔn)確性低。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種惡意網(wǎng)址的分類方法、裝置、計(jì)算機(jī)設(shè)備和可讀存儲(chǔ)介質(zhì),用于解決現(xiàn)有技術(shù)中的上述技術(shù)問(wèn)題。
一方面,為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種惡意網(wǎng)址的分類方法。
該惡意網(wǎng)址的分類方法包括:獲取目標(biāo)網(wǎng)址對(duì)應(yīng)的網(wǎng)絡(luò)資源;提取所述網(wǎng)絡(luò)資源中的靜態(tài)資源和動(dòng)態(tài)資源;通過(guò)預(yù)設(shè)的第一分類模型分類所述靜態(tài)資源,以得到所述目標(biāo)網(wǎng)址對(duì)應(yīng)的第一分類信息;通過(guò)預(yù)設(shè)的第二分類模型分類所述動(dòng)態(tài)資源,以得到所述目標(biāo)網(wǎng)址對(duì)應(yīng)的第二分類信息;以及根據(jù)所述第一分類信息和所述第二分類信息確定所述目標(biāo)網(wǎng)址所屬的惡意網(wǎng)址類別。
進(jìn)一步地,所述靜態(tài)資源包括頁(yè)面head標(biāo)簽內(nèi)的meta字段、頁(yè)面標(biāo)題和/或頁(yè)面body標(biāo)簽內(nèi)的文字,所述第一分類模型為文本分類模型,通過(guò)預(yù)設(shè)的第一分類模型分類所述靜態(tài)資源,以得到所述目標(biāo)網(wǎng)址對(duì)應(yīng)的第一分類信息的步驟包括:根據(jù)所述靜態(tài)資源構(gòu)建詞序列;將所述詞序列輸入所述文本分類模型,其中,所述文本分類模型用于根據(jù)所述詞序列確定所述第一分類信息。
進(jìn)一步地,根據(jù)所述靜態(tài)資源構(gòu)建詞序列的步驟包括:將所述靜態(tài)資源劃分為至少兩個(gè)文本類;對(duì)所述文本類進(jìn)行分詞得到詞序列;所述文本分類模型包括第一卷積層、第一池化層和第一全連接層,所述第一卷積層包括至少兩個(gè)串聯(lián)的文本卷積核,將所述詞序列輸入所述文本分類模型的步驟包括:將每個(gè)所述文本類對(duì)應(yīng)的所述詞序列作為一維向量輸入至第一個(gè)文本卷積核;將最后一個(gè)所述文本卷積核的輸出輸入至所述第一池化層;將所述第一池化層的輸出輸入至所述第一全連接層,其中,所述第一全連接層輸出所述第一分類信息。
進(jìn)一步地,將所述靜態(tài)資源劃分為至少兩個(gè)文本類的步驟包括:將所述頁(yè)面標(biāo)題劃分為標(biāo)題文本類,將所述meta字段劃分為頭文本類,將所述頁(yè)面body標(biāo)簽內(nèi)的文字劃分為內(nèi)容文本類。
進(jìn)一步地,所述動(dòng)態(tài)資源包括頁(yè)面加載的腳本程序和/或css資源文件,所述第二分類模型為二進(jìn)制分類模型,通過(guò)預(yù)設(shè)的第二分類模型分類所述動(dòng)態(tài)資源,以得到所述目標(biāo)網(wǎng)址對(duì)應(yīng)的第二分類信息的步驟包括:根據(jù)所述動(dòng)態(tài)資源構(gòu)建二進(jìn)制片段序列;將所述二進(jìn)制片段序列輸入所述二進(jìn)制分類模型,其中,所述二進(jìn)制分類模型用于根據(jù)所述二進(jìn)制片段序列確定所述第二分類信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于奇安信科技集團(tuán)股份有限公司;網(wǎng)神信息技術(shù)(北京)股份有限公司,未經(jīng)奇安信科技集團(tuán)股份有限公司;網(wǎng)神信息技術(shù)(北京)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011027013.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 惡意特征數(shù)據(jù)庫(kù)的建立方法、惡意對(duì)象檢測(cè)方法及其裝置
- 用于檢測(cè)惡意鏈接的方法及系統(tǒng)
- 惡意信息識(shí)別方法、惡意信息識(shí)別裝置及系統(tǒng)
- 主動(dòng)式移動(dòng)終端惡意軟件網(wǎng)絡(luò)流量數(shù)據(jù)集獲取方法及系統(tǒng)
- 一種大數(shù)據(jù)告警平臺(tái)系統(tǒng)及其方法
- 一種追溯惡意進(jìn)程的方法、裝置及存儲(chǔ)介質(zhì)
- 一種相似惡意軟件推薦方法、裝置、介質(zhì)和設(shè)備
- 軟件惡意行為檢測(cè)方法及系統(tǒng)
- 惡意樣本增強(qiáng)方法、惡意程序檢測(cè)方法及對(duì)應(yīng)裝置
- 惡意語(yǔ)音樣本的確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 移動(dòng)終端上網(wǎng)安全控制的裝置和方法
- 網(wǎng)址分類方法
- 一種網(wǎng)址推送方法及系統(tǒng)
- 用于網(wǎng)址導(dǎo)航的方法和裝置
- 一種網(wǎng)址糾錯(cuò)方法、服務(wù)器、終端,及系統(tǒng)
- 網(wǎng)址劫持檢測(cè)的方法及裝置
- 短網(wǎng)址信息顯示系統(tǒng)及方法
- 一種網(wǎng)址推薦方法、服務(wù)器及終端
- 一種通過(guò)短網(wǎng)址訪問(wèn)網(wǎng)站的方法、系統(tǒng)、裝置及介質(zhì)
- 一種網(wǎng)址訪問(wèn)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





