[發(fā)明專利]一種釣魚網(wǎng)站的識別方法及裝置有效
| 申請?zhí)枺?/td> | 201711085177.6 | 申請日: | 2017-11-07 |
| 公開(公告)號: | CN109756467B | 公開(公告)日: | 2021-04-27 |
| 發(fā)明(設計)人: | 李彬;袁靜;郝建忠;鄭浩彬;鐘雪慧;呂漢鑫 | 申請(專利權(quán))人: | 中國移動通信集團廣東有限公司;中國移動通信集團公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王瑩;李相雨 |
| 地址: | 510623 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 釣魚 網(wǎng)站 識別 方法 裝置 | ||
本發(fā)明實施例提供一種釣魚網(wǎng)站的識別方法及裝置。所述方法包括:獲取預設時段內(nèi)用戶的訪問網(wǎng)絡行為日志,訪問網(wǎng)絡行為日志包括訪問網(wǎng)頁信息、訪問時刻和用戶手機號碼;根據(jù)黑名單網(wǎng)頁庫確定目標號碼集合,目標號碼集合包括訪問網(wǎng)頁信息為黑名單網(wǎng)頁的目標用戶手機號碼和訪問黑名單網(wǎng)頁的第一訪問時刻;確定與第一訪問時刻間隔小于預設時長閾值的第二訪問時刻集合和待識別訪問網(wǎng)頁子集,確定目標號碼集合對應的待識別網(wǎng)頁集合;將待識別網(wǎng)頁集合中的每個待識別訪問網(wǎng)頁與黑名單網(wǎng)頁庫進行相似度計算,確定待識別訪問網(wǎng)頁是否為釣魚網(wǎng)站。本發(fā)明實施例對可疑網(wǎng)頁集合體進行識別,提高了釣魚網(wǎng)站識別效率。
技術(shù)領(lǐng)域
本發(fā)明實施例涉及網(wǎng)絡安全技術(shù)領(lǐng)域,具體涉及一種釣魚網(wǎng)站的識別方法及裝置。
背景技術(shù)
據(jù)工信部的數(shù)據(jù)顯示,截止到2017年5月末,我國移動電話用戶總數(shù)達到13.88億戶,其中2017年1-5月凈增3910萬戶。2G和3G用戶穩(wěn)步向4G用戶轉(zhuǎn)換,4G用戶持續(xù)爆發(fā)式增長,總數(shù)達到7.14億戶,占移動電話用戶的比重達到54.1%,新形勢下,移動支付開始普及并快速發(fā)展,電信詐騙問題也逐步凸顯。經(jīng)中國反釣魚網(wǎng)站聯(lián)盟10月處理報告顯示,截至2017年5月份,聯(lián)盟累計認定并處理釣魚網(wǎng)站382969個,其中僅在5月就發(fā)現(xiàn)處理了877個釣魚網(wǎng)站。妄圖偷取用戶隱私信息的不法分子越來越活躍,惡意釣魚網(wǎng)站引起詐騙案例層出不窮,這種電信網(wǎng)絡新型違法犯罪行為,已成為影響社會穩(wěn)定和群眾安全感的突出犯罪問題,惡意虛假釣魚攻擊已成為全世界共同面臨的網(wǎng)絡安全問題,是全球互聯(lián)網(wǎng)行業(yè)急需解決的問題,因此加強對釣魚網(wǎng)站識別的研究具有重要的現(xiàn)實意義。
目前有三種釣魚網(wǎng)站識別方法,分別是URL黑白名單過濾方法,URL機器學習檢測方法和基于網(wǎng)頁內(nèi)容的相似度識別方法,其中URL黑白名單過濾方法,前期需要通過人工方式收集黑白名單,主要應用在瀏覽器上,當用戶訪問網(wǎng)頁時使用黑白名單進行對該網(wǎng)頁進行全匹配,這種方法覆蓋范圍小,對于目前的互聯(lián)網(wǎng)發(fā)展速度,有一定的局限性。URL機器學習檢測方法基于各種URL相似度及分類算法,利用已經(jīng)發(fā)現(xiàn)的釣魚網(wǎng)站進行學習訓練,建立起強大的黑名單訓練集,當用戶訪問網(wǎng)頁時,根據(jù)黑名單訓練集對訪問網(wǎng)頁進行分類,URL機器學習檢測方法前提必須收集到足夠多的釣魚網(wǎng)站,然而釣魚網(wǎng)站的存活時間短,需要及時捕獲釣魚網(wǎng)站進行訓練,對系統(tǒng)數(shù)據(jù)的精確定位和時效性要求非常高?;诰W(wǎng)頁內(nèi)容的相似度識別方法是對用戶訪問網(wǎng)頁的元素進行特征挖掘,如URL、域名、圖片、組成、頁面關(guān)鍵詞等,通過分類預測計算進行識別。然而上述三種識別方法對數(shù)據(jù)利用率較低:都是針對單個網(wǎng)頁的內(nèi)容元素進行特征識別(如URL、域名、IP、網(wǎng)頁內(nèi)容等),屬于個體識別技術(shù),在移動互聯(lián)網(wǎng)中,識別單個網(wǎng)站實際上并不能發(fā)揮移動互聯(lián)網(wǎng)的大數(shù)據(jù)優(yōu)勢,識別效率較低。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明實施例提供了一種釣魚網(wǎng)站的識別方法及裝置。
第一方面,本發(fā)明實施例提供一種釣魚網(wǎng)站的識別方法,包括:
獲取預設時段內(nèi)用戶的訪問網(wǎng)絡行為日志,所述訪問網(wǎng)絡行為日志包括訪問網(wǎng)頁信息、訪問時刻和用戶手機號碼;
根據(jù)黑名單網(wǎng)頁庫匹配所述訪問網(wǎng)頁信息,確定所述訪問網(wǎng)絡行為日志對應的目標號碼集合,所述目標號碼集合包括訪問網(wǎng)頁信息為黑名單網(wǎng)頁的目標用戶手機號碼和所述目標用戶手機號碼訪問黑名單網(wǎng)頁的第一訪問時刻;
根據(jù)所述目標用戶手機號碼對應的訪問網(wǎng)絡行為日志,確定與所述第一訪問時刻間隔小于預設時長閾值的第二訪問時刻集合,以及與所述第二訪問時刻集合對應的待識別訪問網(wǎng)頁子集,根據(jù)每個所述目標用戶手機號碼對應的待識別訪問網(wǎng)頁子集確定所述目標號碼集合對應的待識別網(wǎng)頁集合;
將所述待識別網(wǎng)頁集合中的每個待識別訪問網(wǎng)頁與黑名單網(wǎng)頁庫進行相似度計算,確定所述待識別訪問網(wǎng)頁是否為釣魚網(wǎng)站。
第二方面,本發(fā)明實施例提供一種釣魚網(wǎng)站的識別裝置,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國移動通信集團廣東有限公司;中國移動通信集團公司,未經(jīng)中國移動通信集團廣東有限公司;中國移動通信集團公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711085177.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





