[發(fā)明專利]一種基于web自動化測試和寬度學(xué)習(xí)的釣魚網(wǎng)站檢測方法有效
| 申請?zhí)枺?/td> | 201810088364.8 | 申請日: | 2018-01-30 |
| 公開(公告)號: | CN108337255B | 公開(公告)日: | 2020-08-04 |
| 發(fā)明(設(shè)計(jì))人: | 袁巍;聶依凡;李浩鵬;賈昂;蔡明輝;姜源 | 申請(專利權(quán))人: | 華中科技大學(xué) |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F16/955 |
| 代理公司: | 華中科技大學(xué)專利中心 42201 | 代理人: | 王世芳;李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 web 自動化 測試 寬度 學(xué)習(xí) 釣魚 網(wǎng)站 檢測 方法 | ||
1.一種基于寬度學(xué)習(xí)的釣魚網(wǎng)站檢測方法,其特征在于,包括如下步驟:
(1)在PC端對于網(wǎng)站數(shù)據(jù)集里面的大量的釣魚網(wǎng)站和正常網(wǎng)站進(jìn)行靜態(tài)特征提取、動態(tài)特征提取和交互式特征提取,形成特征向量集合;
(2)將步驟(1)中特征向量集合利用k折交叉驗(yàn)證法分為訓(xùn)練集和驗(yàn)證集;
(3)利用所述訓(xùn)練集進(jìn)行寬度學(xué)習(xí)的訓(xùn)練,利用所述驗(yàn)證集進(jìn)行測試對比,構(gòu)建基礎(chǔ)模型并對分類器的性能進(jìn)行優(yōu)化;所述分類器的性能是指分類器識別釣魚網(wǎng)站的正確率;
(4)收集誤判網(wǎng)站和新收錄的網(wǎng)站作為新的特征向量集合,對模型進(jìn)行增加輸入的增量學(xué)習(xí),以優(yōu)化模型;
步驟(1)具體為:
(1.1)對于url進(jìn)行靜態(tài)特征提取;所述靜態(tài)特征包括:url的域名從開始到第一個點(diǎn)之間是否是純數(shù)字、url的長度是否小于23個字符;
(1.2)利用web自動化測試技術(shù)模擬無界面瀏覽器,對數(shù)據(jù)集的url進(jìn)行訪問;
(1.3)對于url訪問的頁面進(jìn)行動態(tài)特征提取;所述動態(tài)特征包括:圖片的resource是否和原url同域名;
(1.4)模擬瀏覽器對頁面進(jìn)行交互式點(diǎn)擊瀏覽,并返回交互式特征。
2.如權(quán)利要求1所述的一種基于寬度學(xué)習(xí)的釣魚網(wǎng)站檢測方法,其特征在于,步驟(1.1)中所述靜態(tài)特征還包括:
①url中是否含有ip地址;
③url里是否含有敏感字符,所述敏感字符包括@;
④url端口是否是80端口;
⑥url里是否包含涉及到購物或財(cái)產(chǎn)賬號的關(guān)鍵字,該關(guān)鍵字包括account,banking,taobao。
3.如權(quán)利要求1所述的一種基于寬度學(xué)習(xí)的釣魚網(wǎng)站檢測方法,其特征在于,步驟(1.3)中所述動態(tài)特征還包括:
①html的title是否包含敏感字符,所述敏感字符包括‘彩票’,‘境外賭博’,‘中獎’;
②是否有form表單;
④鏈接的href是否和url同域名;所述href是Hypertext Reference的縮寫,是指定超鏈接目標(biāo)的url。
4.如權(quán)利要求1所述的一種基于寬度學(xué)習(xí)的釣魚網(wǎng)站檢測方法,其特征在于,步驟(1.4)中所述交互式特征包括:
①form表單是否嚴(yán)謹(jǐn);
②點(diǎn)擊鏈接,是否為空;
③點(diǎn)擊鏈接,是否發(fā)生url重定向。
5.如權(quán)利要求1所述的一種基于寬度學(xué)習(xí)的釣魚網(wǎng)站檢測方法,其特征在于,步驟(2)具體為:
(2.1)設(shè)定k值;
(2.2)利用k折交叉驗(yàn)證法對步驟(1)的數(shù)據(jù)集進(jìn)訓(xùn)練集和驗(yàn)證集的劃分。
6.如權(quán)利要求1所述的一種基于寬度學(xué)習(xí)的釣魚網(wǎng)站檢測方法,其特征在于,步驟(3)具體為:
(3.1)利用步驟(2)的訓(xùn)練集中網(wǎng)頁樣本的特征向量集合對寬度學(xué)習(xí)模型進(jìn)行訓(xùn)練并測試分類器性能;
(3.2)通過增加特征節(jié)點(diǎn)和增強(qiáng)型節(jié)點(diǎn)不斷調(diào)整網(wǎng)絡(luò)架構(gòu)進(jìn)行訓(xùn)練并測試直到分類器達(dá)到預(yù)期性能,獲取各層權(quán)重信息并保存模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué),未經(jīng)華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810088364.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 提供共享Web模塊的系統(tǒng)和方法
- 管理環(huán)球網(wǎng)網(wǎng)頁中的環(huán)球網(wǎng)媒體的系統(tǒng)及其實(shí)現(xiàn)方法
- 一種WEB業(yè)務(wù)實(shí)現(xiàn)系統(tǒng)、裝置及方法
- 高速緩存廣播信息的方法和裝置
- 基于QoS指標(biāo)和Web服務(wù)輸出參數(shù)的Web服務(wù)組合方法和裝置
- Web托管審查方法、裝置及Web托管系統(tǒng)
- 用于信息處理和Web瀏覽歷史導(dǎo)航的方法和設(shè)備及電子裝置
- 用于將web站點(diǎn)轉(zhuǎn)換為目標(biāo)web app站點(diǎn)的方法和裝置
- 用于防護(hù)WEB漏洞的方法和設(shè)備
- 一種Web攻擊報(bào)告生成方法、裝置、設(shè)備及計(jì)算機(jī)介質(zhì)
- 自動化設(shè)備和自動化系統(tǒng)
- 一種基于流程驅(qū)動的測試自動化方法以及測試自動化系統(tǒng)
- 用于工業(yè)自動化設(shè)備認(rèn)識的系統(tǒng)和方法
- 實(shí)現(xiàn)過程自動化服務(wù)的標(biāo)準(zhǔn)化設(shè)計(jì)方法學(xué)的自動化系統(tǒng)
- 一種日產(chǎn)50萬安時勻漿自動化系統(tǒng)
- 一種自動化肥料生產(chǎn)系統(tǒng)
- 一種電氣自動化設(shè)備自動檢測系統(tǒng)及檢測方法
- 用于自動化應(yīng)用的抽象層
- 一種基于虛擬化架構(gòu)的自動化系統(tǒng)功能驗(yàn)證方法
- 自動化測試框架自動測試的實(shí)現(xiàn)技術(shù)





