[發明專利]基于特征庫檢測釣魚欺詐網頁的方法及系統、客戶端、服務器有效
| 申請號: | 201310729000.0 | 申請日: | 2013-12-25 |
| 公開(公告)號: | CN103685307B | 公開(公告)日: | 2017-08-11 |
| 發明(設計)人: | 陳勁;牛成 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 北京市浩天知識產權代理事務所(普通合伙)11276 | 代理人: | 宋菲,劉云貴 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 檢測 釣魚 欺詐 網頁 方法 系統 客戶端 服務器 | ||
1.一種基于特征庫檢測釣魚欺詐網頁的方法,所述方法由客戶端執行,包括:
在訪問頁面加載完成后,提取頁面的多個內容片段,獲取每個內容片段對應的特征ID;
將多個內容片段對應的特征ID與特征庫中的特征ID進行匹配;其中,所述特征庫是惡意/欺詐/釣魚頁面中的包含惡意信息的內容片段對應的特征ID的集合;
若多個內容片段對應的特征ID中不具有與特征庫中的特征ID匹配的至少一個特征ID,則允許所述頁面的訪問行為;
若多個內容片段對應的特征ID中具有與特征庫中的特征ID匹配的至少一個特征ID,則根據所述頁面的信息,計算所述頁面的評估分;
接收服務器端返回的根據預先建立的模板ID與分類信息的對應關系所確定的匹配的模板ID所對應的分類信息;其中,匹配的模板ID是將由匹配的至少一個特征ID經組合計算得到的至少一個模板ID與模板庫中的模板ID進行匹配得到的;
根據所述頁面的評估分與設定閾值的比較結果,對所述頁面的訪問行為進行處理。
2.根據權利要求1所述的方法,所述特征庫是預先從服務器端下載的;所述服務器端獲取惡意/欺詐/釣魚頁面的樣本,對樣本進行機器學習建立所述特征庫;所述服務器端定期更新所述特征庫并同步給客戶端。
3.根據權利要求2所述的方法,所述對樣本進行機器學習建立所述特征庫具體為:利用貝葉斯統計概率模型和神經網絡模型,對樣本進行機器學習建立所述特征庫。
4.根據權利要求1-3任一項所述的方法,所述根據所述頁面的評估分與設定閾值的比較結果,對所述頁面的訪問行為進行處理進一步包括:
將所述頁面的評估分與所述設定閾值進行比較,若所述頁面的評估分高于設定閾值,則攔截所述頁面的訪問行為或進行風險提示;否則,允許所述頁面的訪問行為。
5.根據權利要求1-3任一項所述的方法,所述根據所述頁面的信息,計算所述頁面的評估分具體為:根據以下有關所述頁面的邏輯結果中的一個或多個的組合,計算所述頁面的評估分:
所述頁面的URL是否屬于本地黑/白名單;
所述頁面的URL是否屬于高危域名或高危IP;
所述頁面的refer信息是否為高危refer信息;
根據所述匹配的至少一個特征ID而判定的所述頁面內容是否為高危頁面內容;
所述頁面對應的網站服務器是否為高危服務器;
所述頁面對應的網站注冊郵箱是否屬于郵箱黑名單;
所述頁面對應的網站注冊時間是否短于預設時長。
6.根據權利要求4所述的方法,所述服務器端還包含模板庫,所述模板庫中包含由所述特征庫中的多個特征ID進行各種組合計算得到的多個模板ID;
所述方法還包括:若多個內容片段對應的特征ID中具有與特征庫中的特征ID匹配的至少一個特征ID,則將所述匹配的至少一個特征ID上報給服務器端,以供所述服務器端將所述匹配的至少一個特征ID進行組合計算得到至少一個模板ID,將該至少一個模板ID與所述模板庫中的模板ID進行匹配;若所述至少一個模板ID中具有與模板庫中的模板ID匹配的模板ID,根據預先建立的模板ID與分類信息的對應關系,確定所述匹配的模板ID所對應的分類信息;將所述分類信息返回給客戶端;
接收所述服務器端返回的所述匹配的模板ID所對應的分類信息,在進行風險提示的同時展示所述分類信息。
7.根據權利要求4所述的方法,還包括:
若所述頁面的評估分高于設定閾值,則將所述頁面的URL以及鑒定識別信息加密成密文上報給服務器端,以供服務器端將所述頁面的URL加入惡意網址庫。
8.根據權利要求1-3任一項所述的方法,所述提取頁面的多個內容片段進一步包括:
從所述頁面的第一個字節開始,依次遍歷多個預定長度的二進制數據片段;
對每個二進制數據片段進行篩選,若為無用片段,則丟棄;若為有用片段,則記錄該二進制數據片段作為所述內容片段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310729000.0/1.html,轉載請聲明來源鉆瓜專利網。





