[發(fā)明專利]一種基于web自動化測試和寬度學習的釣魚網(wǎng)站檢測方法有效
| 申請?zhí)枺?/td> | 201810088364.8 | 申請日: | 2018-01-30 |
| 公開(公告)號: | CN108337255B | 公開(公告)日: | 2020-08-04 |
| 發(fā)明(設計)人: | 袁巍;聶依凡;李浩鵬;賈昂;蔡明輝;姜源 | 申請(專利權(quán))人: | 華中科技大學 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F16/955 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 王世芳;李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 web 自動化 測試 寬度 學習 釣魚 網(wǎng)站 檢測 方法 | ||
本發(fā)明公開了一種基于web自動化測試和寬度學習的釣魚網(wǎng)站檢測方法,屬于計算機網(wǎng)絡安全技術(shù)領(lǐng)域。本發(fā)明先基于url和html頁面進行傳統(tǒng)特征提取,再利用web自動化測試技術(shù)來進行交互式特征提取,最后利用提取特征后的預處理訓練樣本進行寬度學習訓練,從而準確快速地識別和檢測釣魚網(wǎng)站,保護民眾的網(wǎng)絡信息和財產(chǎn)安全。
技術(shù)領(lǐng)域
本發(fā)明屬于計算機網(wǎng)絡安全技術(shù)領(lǐng)域,更具體地,涉及一種基于web自動化測試和寬度學習的釣魚網(wǎng)站檢測方法。
背景技術(shù)
網(wǎng)絡釣魚是通過大量發(fā)送聲稱來自于銀行或知名機構(gòu)的欺騙性垃圾郵件、網(wǎng)頁虛假廣告等,竊取用戶的個人身份數(shù)據(jù)和金融賬號等敏感信息的一種攻擊方式。最典型的網(wǎng)絡釣魚攻擊是將用戶引誘到一個精心設計的與目標組織的網(wǎng)站極其相似的釣魚網(wǎng)站上,獲取用戶在該網(wǎng)站上輸入的個人敏感信息或騙取用戶匯款。由于這類攻擊過程受害者不易警覺,釣魚網(wǎng)站已經(jīng)成為目前最為嚴重的互聯(lián)網(wǎng)犯罪手段之一,而釣魚網(wǎng)站的檢測也成為網(wǎng)絡安全領(lǐng)域最熱門的研究方向之一。
2016年,由CNNIC牽頭籌建的互聯(lián)網(wǎng)域名管理技術(shù)國家工程實驗室與國際反釣魚工作組(APWG)、中國反釣魚網(wǎng)站聯(lián)盟(APAC)聯(lián)合發(fā)布了《全球中文釣魚網(wǎng)站現(xiàn)狀統(tǒng)計分析報告(2016年)》(以下簡稱《報告》)。數(shù)據(jù)顯示,2016年我國釣魚網(wǎng)站數(shù)量同比增長150.96%,主要仿冒對象為淘寶、中移動,各大銀行,所使用的域名主要有.COM、.CC、.PW、.NET。
2017年第三季度360手機衛(wèi)士為全國手機用戶攔截釣魚網(wǎng)站計7.9億次,較2016年第三季度增長102.6%。對所攔截的手機端釣魚網(wǎng)站分類,其中賭博博彩類釣魚網(wǎng)站占總體比重的80.2%,虛假購物、虛假招聘、金融證券、假藥以及釣魚廣告等類型占比依次遞減。
雖然攔截數(shù)量很多,但攔截的網(wǎng)站大部分是已長時間存在,難以捕獲和封鎖最新的釣魚網(wǎng)站。釣魚網(wǎng)站的生命周期平均只有4.684天,而舉報的平均周期13.327天,對于釣魚網(wǎng)站,必須在極短的時間內(nèi)識別和攔截,否則會對民眾的財產(chǎn)安全造成威脅。
目前對于釣魚網(wǎng)站的識別和攔截技術(shù)由殺毒軟件和瀏覽器自身來執(zhí)行,其技術(shù)分為以下幾類:
①黑名單過濾技術(shù):將人工檢測和民眾舉報的釣魚網(wǎng)站加入黑名單,當訪問的url(Uniform Resource Locator,統(tǒng)一資源定位符)存在于黑名單中,實施攔截并提出警告。這種方式不能識別最新的釣魚網(wǎng)站,同時需要人工驗證。
②url的特征提取:通過訪問的url來提取出相應的特征,比如域名,但是這種判定方式不可靠,因為url中并不具有釣魚網(wǎng)站的決定性特征,這類方法的誤判率和漏判率較高。
③結(jié)合各種網(wǎng)站頁面元素作為特征進行釣魚網(wǎng)站的檢測:因為網(wǎng)頁頁面的特征獲取需耗費一定的時間,這類方法在準確度上相比第二類方法有提高,但執(zhí)行的速度和效率都不高。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的以上缺陷或改進需求,本發(fā)明提供了一種基于web自動化測試和寬度學習的釣魚網(wǎng)站檢測方法,其目的在于基于url和html頁面進行傳統(tǒng)特征提取,利用web自動化測試技術(shù)來進行交互式特征提取,利用提取特征后的預處理訓練樣本進行寬度學習訓練,從而準確快速地識別和檢測釣魚網(wǎng)站,保護民眾的網(wǎng)絡信息和財產(chǎn)安全。
為實現(xiàn)上述目的,按照本發(fā)明的一個方面,提供了一種基于web自動化測試和寬度學習的釣魚網(wǎng)站檢測方法,包括如下步驟:
(1)在PC(Personal Computer,個人計算機)端對于數(shù)據(jù)集里面的大量的釣魚網(wǎng)站和正常網(wǎng)站進行靜態(tài)特征提取、動態(tài)特征提取和交互式特征提取,形成特征向量集合;
所述數(shù)據(jù)集來自網(wǎng)絡上搜集的釣魚網(wǎng)站和正常網(wǎng)站,或直接從網(wǎng)絡安全公司獲取;
(2)將步驟(1)中特征向量集合利用k折交叉驗證法分為訓練集和驗證集;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學,未經(jīng)華中科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810088364.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 提供共享Web模塊的系統(tǒng)和方法
- 管理環(huán)球網(wǎng)網(wǎng)頁中的環(huán)球網(wǎng)媒體的系統(tǒng)及其實現(xiàn)方法
- 一種WEB業(yè)務實現(xiàn)系統(tǒng)、裝置及方法
- 高速緩存廣播信息的方法和裝置
- 基于QoS指標和Web服務輸出參數(shù)的Web服務組合方法和裝置
- Web托管審查方法、裝置及Web托管系統(tǒng)
- 用于信息處理和Web瀏覽歷史導航的方法和設備及電子裝置
- 用于將web站點轉(zhuǎn)換為目標web app站點的方法和裝置
- 用于防護WEB漏洞的方法和設備
- 一種Web攻擊報告生成方法、裝置、設備及計算機介質(zhì)





