[發明專利]惡意網站快速識別方法有效
| 申請號: | 201910177897.8 | 申請日: | 2019-03-10 |
| 公開(公告)號: | CN109922065B | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 古元;陳耀遠;陳思萌;毛華陽;華仲鋒;于龍;林飛;王娜;熊翱 | 申請(專利權)人: | 北京亞鴻世紀科技發展有限公司;北京郵電大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F40/284 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100095 北京市海淀區高里*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 惡意 網站 快速 識別 方法 | ||
惡意網站快速識別方法涉及信息安全技術領域。實現本發明的主要步驟包括詞庫匹配篩選步驟,前端劫持判別篩選步驟,可見區域惡意信息的判別篩選步驟;實現本發明可以實時、高效地鑒別惡意網站;實現本發明利用惡意信息分析系統可以有效辨別網頁可見區域內的惡意信息,從而識別出隱藏性較強的惡意網站;實現本發明可以識別劫持網站,避免將其誤判為惡意網站,提高惡意網站檢測準確率。
技術領域
本發明涉及信息技術領域,尤其是信息安全技術領域。
背景技術
隨著互聯網的迅速發展,大數據時代下的互聯網信息呈指數型增長,大量信息資源通過網絡服務共享。網頁瀏覽是當下使用率最高的網絡服務之一,同時也成為不法分子進行惡意攻擊活動的主要渠道,其中惡意信息類網站的傳播范圍廣、影響范圍大,對信息安全構成嚴重威脅。過去,惡意網站的攻擊手法較為直接,用戶只有在訪問此類網站時才有可能受到威脅,而現在,攻擊者還會劫持一些正規網站來傳遞惡意信息,利用合法站點的腳本漏洞攻擊該站點的訪問用戶,即使是受信任的網站也可能遭受惡意攻擊,如網頁部分內容被篡改為惡意信息,或是跳轉到指定的惡意網站情況,同樣會造成用戶財產和個人信息的泄露,由此引發的信息安全威脅愈加嚴重,致使用戶的信息安全無法得到保障。
傳統的惡意網站檢測方法有:人工檢測、基于特征碼的檢測,它們通常是通過人為發現惡意網站或是網站源代碼中的惡意代碼標識進行檢測,這類方法實現簡單,但過于依賴人工的特征篩選,檢測效率與準確率不高。現今,惡意網站的檢測常利用特征分析和統計方法,通過構建文本特征與特征分析來發現網站中的惡意信息。此外,還可以借助虛擬機技術,在虛擬機中模擬真實頁面,實現基于行為的惡意信息檢測。這些方法可以較為有效的檢測到惡意網站,在一定程度上提高了用戶訪問網頁的安全性,但與傳統方法相比其效率較低。而且,新型的惡意網站會通過源代碼偽裝來躲避網絡監管,將惡意的代碼及文本內容利用技術手段隱藏起來,致使檢測器難以發現,現有檢測方法無法滿足用戶訪問網頁的安全新要求。
惡意網站為了躲避網絡監管,其惡意信息一般具有較強隱蔽性,通常會在網頁源碼中利用大量正常的網頁內容文本來混淆惡意信息,致使網頁檢測器難以發現此類網站,當用戶訪問網站時頁面展示的是惡意信息,而網頁源碼中的正常文本部分對用戶是不可見的。另一種惡意信息的傳播方法是劫持正規網站,當正規網站被惡意攻擊后,會出現網頁跳轉、網頁內容被惡意篡改情況,其網站源碼的內容中會包含有惡意信息,誘導網站檢測器將其誤認為是惡意網站。
針對現有技術的不足,區別于傳統的人工檢測和基于特征碼的檢測,并且在效率上優于借助虛擬機技術的惡意網站檢測,本發明方法通過分析頁面可見區域中的惡意信息,可以高效鑒別出隱蔽性較強的惡意網站,同時通過網頁劫持系統的判斷,可以有效避免將被劫持網站當作惡意網站,保證識別系統的準確率和實時性。
共有技術
word2vec是Google開源的一款用于詞向量計算的工具。word2vec不僅可以在百萬數量級的詞典和上億的數據集上進行高效地訓練,還可以得到訓練結果——詞向量(wordembedding),可以很好地度量詞與詞之間的相似性。其實word2vec算法的背后是一個淺層神經網絡,而且還是一個計算word vector的開源工具。當我們在說word2vec算法或模型的時候,其實指的是其背后用于計算word vector的CBoW模型和Skip-gram模型。
發明內容
為克服現有技術的不足,實現本發明的惡意網站快速識別方法主要包含詞庫匹配篩選步驟,前端劫持判別篩選步驟,可見區域惡意信息的判別篩選步驟組成:
1)詞庫匹配篩選步驟
對于惡意網站而言,其源碼中必然會出現惡意詞語,利用詞庫的快速匹配,初步篩選出含有惡意信息的網站,減少識別系統需要判斷的網站數量,提高識別效率;
①構建詞庫
編制惡意詞語,人工收集100個惡意信息詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京亞鴻世紀科技發展有限公司;北京郵電大學,未經北京亞鴻世紀科技發展有限公司;北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910177897.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能鎖管理系統
- 下一篇:一種通信網絡中基于時隙特征的動態水印嵌入及檢測方法





