[發明專利]基于特征庫檢測釣魚欺詐網頁的方法及系統、客戶端、服務器有效
| 申請號: | 201310729000.0 | 申請日: | 2013-12-25 |
| 公開(公告)號: | CN103685307B | 公開(公告)日: | 2017-08-11 |
| 發明(設計)人: | 陳勁;牛成 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 北京市浩天知識產權代理事務所(普通合伙)11276 | 代理人: | 宋菲,劉云貴 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 檢測 釣魚 欺詐 網頁 方法 系統 客戶端 服務器 | ||
技術領域
本發明涉及互聯網技術領域,具體涉及一種基于特征庫檢測釣魚欺詐網頁的方法及系統、客戶端、服務器。
背景技術
隨著互聯網的發展,基于WEB的應用日益普及,人們通過瀏覽器可以查詢銀行賬戶、網上購物、電子商務、查詢信息、獲取知識、進行娛樂等,WEB為人們提供了方便和快捷的交互方式。然而,人們在上網沖浪瀏覽網頁的同時,經常會遭遇到惡意網站的侵襲,導致計算機被病毒、木馬等感染。
惡意網站,例如釣魚網站、或者是欺詐,仿冒網站等,主要是通過仿冒真實網站的URL地址或是頁面內容,偽裝成銀行及電子商務等類型的網站,或是利用真實網站服務器程序上的漏洞,在該網站的某些網頁中插入危險的網頁代碼,以此來騙取用戶銀行或信用卡賬號、密碼等私人資料。惡意網頁中包含著許多敏感的特征,例如,金融欺詐類的惡意網頁會在文字、圖片等方面仿冒官網,或是在真實網頁中插入虛假票務、虛假中獎、假冒網銀、虛假購物等信息,這些特征大多以文本串的形式出現在網頁中。
現有的為了防范惡意網站的主要手段是當用戶訪問某網站時,客戶端將網站的URL發送至服務器端的黑白名單數據庫進行查詢,然而由于釣魚網站不斷更新換代,這種方法對釣魚網站等惡意網站的檢出率不高并具有滯后性。或者是通過基于文本的方法進行識別,例如通過提取頁面中關鍵詞,并將關鍵詞上傳至服務器,在黑名單數據庫中匹配,這種方法效率比較低下,而且容易受文字順序等因素的影響,誤判率較高。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于特征庫檢測釣魚欺詐網頁的方法及系統、客戶端、服務器。
根據本發明的一個方面,提供了一種基于特征庫檢測釣魚欺詐網頁的方法,包括:在訪問頁面加載完成后,提取頁面的多個內容片段,獲取每個內容片段對應的特征ID;將多個內容片段對應的特征ID與特征庫中的特征ID進行匹配;若多個內容片段對應的特征ID中具有與特征庫中的特征ID匹配的至少一個特征ID,則根據頁面的信息,計算頁面的評估分;根據頁面的評估分與設定閾值的比較結果,對頁面的訪問行為進行處理。
根據本發明的另一方面,提供了一種客戶端,包括:服務器下發的特征庫,用于存儲服務器對惡意/欺詐/釣魚頁面的樣本進行機器學習而得到的特征ID;提取模塊,用于在訪問頁面加載完成后,提取頁面的多個內容片段;特征ID獲取模塊,用于獲取每個內容片段對應的特征ID;第一匹配模塊,用于將多個內容片段對應的特征ID與特征庫中的特征ID進行匹配;評估分獲取模塊,用于若多個內容片段對應的特征ID中具有與特征庫中的特征ID匹配的至少一個特征ID,則根據頁面的信息,計算頁面的評估分;處理模塊,用于根據頁面的評估分與設定閾值的比較結果,對頁面的訪問行為進行處理。
根據本發明的另一方面,提供了一種服務器,包括:特征庫,用于存儲對惡意/欺詐/釣魚頁面的樣本進行機器學習而得到的特征ID;網絡接口,用于將特征庫下放給客戶端。
根據本發明的另一方面,提供了一種基于特征庫檢測釣魚欺詐網頁的系統,包括上述客戶端和服務器。
根據本發明的基于特征庫檢測釣魚欺詐網頁的方法及系統、客戶端、服務器,根據提取的頁面的多個內容片段,獲取與每個內容片段對應的特征ID,將多個內容片段對應的特征ID與特征庫中的特征ID進行匹配,對頁面進行初步的識別,如果存在特征ID的匹配,認為該頁面是可能的惡意頁面,根據頁面的信息,計算頁面的評估分;根據頁面的評估分與設定閾值的比較結果,對頁面的訪問行為進行處理。根據該方案,對頁面的識別結合了頁面中的多個內容片斷,以及多項頁面信息;該方案不依賴于服務器端的黑白名單數據庫,而是通過特征庫和對頁面信息的綜合評分實現對惡意/欺詐/釣魚頁面的高效率的識別。通過上述多層次的識別,降低了誤判率,提高了識別準確率。
上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
附圖說明
通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了根據本發明一個實施例的基于特征庫檢測釣魚欺詐網頁的方法的流程圖;
圖2示出了根據本發明另一個實施例的基于特征庫檢測釣魚欺詐網頁的方法的流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310729000.0/2.html,轉載請聲明來源鉆瓜專利網。





