[發明專利]一種面向URL的釣魚網站檢測方法有效
| 申請號: | 202011361704.3 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112468501B | 公開(公告)日: | 2022-10-25 |
| 發明(設計)人: | 朱二周;袁其詳;李薛劍 | 申請(專利權)人: | 安徽大學 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;G06F16/955;G06N3/04 |
| 代理公司: | 南京華恒專利代理事務所(普通合伙) 32335 | 代理人: | 宋方園 |
| 地址: | 230601 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 url 釣魚 網站 檢測 方法 | ||
本發明公開一種面向URL的釣魚網站檢測方法,包括以下步驟:截獲用戶要訪問的URL并發送給服務器端;服務器端將URL分隔成固定長度的五個部分;嵌入層利用CNN和BiLSTM法提取以上五個部分的URL特征并將其轉化成一個向量;利用TF?IDF和注意力機制篩選有用特征以此來降低特征向量的維度,即得到一個精簡的URL最優特征向量;利用數據集訓練全連接層神經網絡分類器;用最優特征向量表示的URL送入全連接層神經網絡分類器,并根據計算出來的概率判定其是否為釣魚網站的URL。本發明充分利用深度學習算法的優點,并且利用Attention機制降低特征維度,大大提高檢測釣魚網站的準確性和速度。
技術領域
本發明屬于信息安全技術,具體涉及一種面向URL的釣魚網站檢測方法。
背景技術
根據APWG(反網絡釣魚工作組)報告,2020年第一季度釣魚網站的數量已達165772個,是2019年第四季度的一倍以上。更為嚴重的是,網絡釣魚攻擊的手段在不斷的更新,網絡釣魚攻擊不再僅限于由電子郵件、即時消息和彈出窗口等傳統媒體發起。當前,移動平臺和社交網站在人們的日常通信中得到了極大的普及和廣泛的應用。新的通信方式不僅給用戶間的溝通帶來了極大的便利,也為網絡釣魚攻擊的傳播提供了新的渠道。例如QR(QuickResponse)代碼、魚叉式網絡、欺騙性移動應用程序都有可能成為傳播釣魚網絡攻擊的途徑。
實際上,釣魚網站檢測是一個二分類問題,檢測的結果只有兩種可能,即“釣魚網站”或“合法網站”。目前,除了通過培訓方式來提高網絡用戶識別網絡釣魚攻擊的能力之外,許多自動化的方法被用來檢測網絡釣魚攻擊,如黑名單法、視覺相似性檢查、基于深度學習和機器學習的方法等。
但是這幾種方法在實際應用時,存在一些問題:黑名單檢測法不分析釣魚網站的內容,很難應對那些沒有出現在黑名單中的釣魚網站的URL;視覺相似性檢查法會給目標平臺帶來較大的計算負擔;基于機器學習的檢測方法中的特征提取時,這些特征一旦被釣魚開發者知曉,他們便可以繞過這些特征的檢測,并且通過手動的提取或第三方服務獲取的特征將導致基于機器學習方法難以處理大規模的網絡釣魚數據集以及檢測效率低下等問題;基于深度學習的檢測方法在使用中不需要人為干預,這會使得最終生成的特征向量維度過大而導致神經網絡學習的速率變緩。
發明內容
發明目的:本發明的目的在于解決現有技術中存在的不足,提供一種面向 URL的釣魚網站檢測方法。
技術方案:本發明的一種面向URL的釣魚網站檢測方法,包括以下步驟:
步驟S1、獲取用戶目標網站的URL并將其發送至服務器端;
步驟S2、服務器端解析所接收到的目標網站的URL,并提取相關特征;
服務器端收到對應URL后先將其按照傳輸協議、子域名、主域名、域名后綴和資源在網站中的路徑解析拆分為五個固定長度的字符串;然后使用獨熱編碼 (one-hotfragment)和嵌入層分別將這個五個字符串變換為向量;接著將對應向量輸入CNN網絡和BiLSTM模型進行特征提取;最后采用改進的注意力 Attention機制進行特征選取最終獲得該URL的最優特征向量;
步驟S3、將所提取的相關特征通過服務器端的神經網絡分類器進行分析判定,以確認目標網站是否為合法網站,并將判定結果返回至目標平臺的WEB瀏覽器;神經網絡分類器中樣本數據集包括釣魚網站URL數據和合法網站URL數據;
步驟S4、WEB瀏覽器收到判定結果后,如果確認是釣魚網站則顯示提示框提醒用戶,如果確認不是釣魚網站則用戶進行正常網頁瀏覽。
進一步的,所述步S1中獲取目標網站URL的方法包括以下:
(a)、跟蹤檢測用戶所點擊使用應用程序(郵件、微信、短信等)的URL 地址;
(b)、跟蹤檢測用戶在瀏覽器地址欄中輸入要訪問的URL地址,并通過按下回車鍵截獲該URL地址。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽大學,未經安徽大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011361704.3/2.html,轉載請聲明來源鉆瓜專利網。





