[發(fā)明專利]基于自適應(yīng)異構(gòu)多分類模型的釣魚網(wǎng)站檢測方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810549417.1 | 申請日: | 2018-05-31 |
| 公開(公告)號: | CN108965245B | 公開(公告)日: | 2021-04-13 |
| 發(fā)明(設(shè)計)人: | 臧天寧;強倩;杜飛;周淵 | 申請(專利權(quán))人: | 國家計算機網(wǎng)絡(luò)與信息安全管理中心;北京銳馳信安技術(shù)有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06K9/62 |
| 代理公司: | 北京永創(chuàng)新實專利事務(wù)所 11121 | 代理人: | 祗志潔 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 自適應(yīng) 異構(gòu)多 分類 模型 釣魚 網(wǎng)站 檢測 方法 系統(tǒng) | ||
本發(fā)明提供了一種基于自適應(yīng)異構(gòu)多分類模型的釣魚網(wǎng)站檢測方法和系統(tǒng)。所述方法對多種基分類算法通過線性加成構(gòu)建自適應(yīng)異構(gòu)多分類模型,對多分類模型進行訓(xùn)練,該模型輸入是各基分類算法的輸入,輸出是樣本標簽,每個基分類算法從樣本記錄中提取相應(yīng)的特征作為輸入;采用機器學(xué)習(xí)算法求解模型參數(shù),并用測試集進行測試和優(yōu)化,最終得到該類釣魚網(wǎng)站的檢測模型。所述系統(tǒng)包括域名詞素特征分類器、主題索引特征分類器、內(nèi)容相似性特征分類器、結(jié)構(gòu)樣式特征分類器、視覺規(guī)則特征分類器、線性加成訓(xùn)練模塊、集成分類器、訓(xùn)練數(shù)據(jù)集管理模塊和檢測及告警模塊。本發(fā)明實現(xiàn)對釣魚網(wǎng)站實時檢測,并提高了釣魚網(wǎng)站檢測的準確性和穩(wěn)定性。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機網(wǎng)絡(luò)安全領(lǐng)域,具體涉及一種基于自適應(yīng)異構(gòu)多分類模型的釣魚網(wǎng)站檢測方法和系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展,網(wǎng)絡(luò)安全問題層出不窮。網(wǎng)絡(luò)釣魚是一種典型的在線欺詐行為,它以互聯(lián)網(wǎng)為載體,通過偽裝成信譽良好的合法網(wǎng)站欺騙用戶以獲得用戶的敏感信息,被欺騙的用戶會產(chǎn)生不同程度的個人信息泄漏,繼而導(dǎo)致經(jīng)濟損失。如何快速準確地檢測釣魚網(wǎng)站成為Web(全球廣域網(wǎng))信息安全研究熱點。目前已公開的釣魚網(wǎng)站檢測技術(shù)主要包括以下幾種方式:
(1)基于黑白名單機制的檢測技術(shù):作為一種實用的核心技術(shù),黑白名單具有高效準確的優(yōu)點。通過對域名的判定,可以快速定位釣魚網(wǎng)站,是最常用的實現(xiàn)技術(shù)之一[1]。
(2)基于視覺相似度的檢測技術(shù):曹久新等人提出了一個基于嵌套EMD(EarthMover’s Distance)的網(wǎng)頁相似度判定算法,對Web圖像進行分割,利用分割后的子圖特征來構(gòu)建網(wǎng)頁的ARG(Attributed Relational Graph)。計算得到不同的AGR屬性的距離后,通過嵌套EMD方法得到釣魚網(wǎng)站與受保護網(wǎng)站網(wǎng)頁的相似度,進而實現(xiàn)對釣魚網(wǎng)站的高精度檢測[2]。
李喧等人基于EMD算法,利用視覺上的相似度來判別釣魚網(wǎng)站。該種算法采用網(wǎng)頁中像素相似度的比較所得的結(jié)果作為判斷釣魚網(wǎng)站的依據(jù)[3]。
(3)基于貝葉斯算法的檢測技術(shù):金慶等人基于規(guī)則的貝葉斯算法,制定了一系列的匹配釣魚網(wǎng)站的規(guī)則。隨后為每個規(guī)則分配其相應(yīng)的權(quán)值,計算其修正系數(shù),得出被測網(wǎng)站是釣魚網(wǎng)站的概率。進而可通過概率閾值判斷其是否為釣魚網(wǎng)站[4][5]。
莊蔚蔚等人對網(wǎng)頁標簽標題內(nèi)容,網(wǎng)站中關(guān)鍵字信息、頁面描述信息、圖片鏈接以及網(wǎng)站版權(quán)信息等8個特征,利用擴展貝葉斯算法化及其改進后的支撐向量機來進行分類集成,構(gòu)建出一種能夠?qū)W(wǎng)絡(luò)釣魚攻擊進行智能檢測的系統(tǒng)[6]。
(4)基于文檔結(jié)構(gòu)的檢測技術(shù):郭敏哲等人分析了Web網(wǎng)頁文檔對象,提取文本對象模型中的常被釣魚者利用的網(wǎng)絡(luò)釣魚敏感信息特征,來判斷該網(wǎng)站是否為釣魚網(wǎng)站。該算法有效地濾除了網(wǎng)站中的Phishing(網(wǎng)絡(luò)仿冒)頁面,強有力的制止了網(wǎng)絡(luò)釣魚者的惡意鉤魚攻擊[7]。
(5)基于深度學(xué)習(xí)的釣魚網(wǎng)站檢測技術(shù):許瓏于結(jié)合深度學(xué)習(xí)的技術(shù),提出了多層結(jié)構(gòu)的DBN-KNN模型,將其運用到釣魚網(wǎng)站的特征識別中,識別出釣魚網(wǎng)站[8]。
(6)其它類型的檢測技術(shù):黃華軍等人提出基于半脆弱水印的網(wǎng)絡(luò)釣魚主動防御[9]以及基于異常特征釣魚URL檢測算法[10];張健毅等人提出一種文本語義理解的網(wǎng)絡(luò)鉤魚檢查算法[11];其余防御措施包括針對web-mail郵箱的跨站網(wǎng)絡(luò)釣魚攻擊的研巧、基于云計算的URL過濾[12]、SVM學(xué)習(xí)算法[13]等。
在以上技術(shù)中,基于黑白名單的檢測方法時效性較差、名單范圍也存在不足;基于視覺相似度的檢測技術(shù)算法復(fù)雜,檢測消耗的時間較長,不能適用于海量URL(UniformResoure Locator:統(tǒng)一資源定位器)的在線實時檢測;基于貝葉斯算法的檢測技術(shù)在魯棒性和泛化性能上不是很理想;基于文檔結(jié)構(gòu)的檢測技術(shù)存在特征覆蓋不全面的問題,漏報較多;基于深度學(xué)習(xí)的釣魚網(wǎng)站檢測技術(shù)在特征識別上有優(yōu)勢,但特征的穩(wěn)定性較差,容易受到樣本污染的干擾。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國家計算機網(wǎng)絡(luò)與信息安全管理中心;北京銳馳信安技術(shù)有限公司,未經(jīng)國家計算機網(wǎng)絡(luò)與信息安全管理中心;北京銳馳信安技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810549417.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 使用后向自適應(yīng)規(guī)則進行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺
- 采用自適應(yīng)機匣和自適應(yīng)風扇的智能發(fā)動機
- 一種自適應(yīng)樹木自動涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動機燃氣自適應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 多源異構(gòu)數(shù)據(jù)高效匯聚存取架構(gòu)系統(tǒng)
- 用于電網(wǎng)的多源異構(gòu)數(shù)據(jù)處理方法及裝置
- 一種配用電數(shù)據(jù)的處理方法及系統(tǒng)
- 一種多異構(gòu)控制站的通信方法和裝置
- 一種面向水下探測的多源異構(gòu)數(shù)據(jù)預(yù)處理方法及系統(tǒng)
- 一種基于深度學(xué)習(xí)的綜采工作面多源異構(gòu)數(shù)據(jù)融合方法
- 基于業(yè)務(wù)規(guī)則的多源異構(gòu)數(shù)據(jù)表示與分發(fā)方法、裝置
- 一種基于邊緣計算的電力異構(gòu)數(shù)據(jù)處理方法
- 適用于多源異構(gòu)電網(wǎng)的運行方式拓撲結(jié)構(gòu)特征提取方法
- 一種多源異構(gòu)數(shù)據(jù)的描述方法、解析方法及裝置





