[發明專利]基于圖片匹配檢測釣魚網頁的方法及裝置有效
| 申請號: | 201410392300.9 | 申請日: | 2014-08-11 |
| 公開(公告)號: | CN104143008B | 公開(公告)日: | 2017-10-27 |
| 發明(設計)人: | 李曉波;尹露;楊晶;郭峰 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市浩天知識產權代理事務所(普通合伙)11276 | 代理人: | 宋菲,劉云貴 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖片 匹配 檢測 釣魚 網頁 方法 裝置 | ||
技術領域
本發明涉及互聯網技術領域,具體涉及一種基于圖片匹配檢測釣魚網頁的方法及裝置。
背景技術
隨著互聯網的發展,基于WEB的應用日益普及,人們通過瀏覽器可以查詢銀行賬戶、網上購物、電子商務、查詢信息、獲取知識、進行娛樂等,WEB為人們提供了方便和快捷的交互方式。然而,人們在上網沖浪瀏覽網頁的同時,經常會遭遇到惡意網站的侵襲,導致計算機被病毒、木馬等感染。
惡意網站,例如釣魚網站、或者是欺詐,仿冒網站等,主要是通過仿冒真實網站的URL地址或是網頁內容,偽裝成銀行及電子商務等類型的網站,或是利用真實網站服務器程序上的漏洞,在該網站的某些網頁中插入危險的網頁代碼,以此來騙取用戶銀行或信用卡賬號、密碼等私人資料。惡意網頁中包含著許多敏感的特征,例如,金融欺詐類的惡意網頁會在文字、圖片等方面仿冒官網,或是在真實網頁中插入虛假票務、虛假中獎、假冒網銀、虛假購物等信息,這些特征大多以文本串的形式出現在網頁中。
現有的為了防范惡意網站的主要手段是當用戶訪問某網站時,客戶端將網站的URL發送至服務器端的黑白名單數據庫進行查詢,然而由于釣魚網站不斷更新換代,這種方法對釣魚網站等惡意網站的檢出率不高并具有滯后性。或者是通過基于文本的方法進行識別,例如通過提取頁面中關鍵詞,并將關鍵詞上傳至服務器,在黑名單數據庫中匹配,這種方法效率比較低下,而且容易受文字順序等因素的影響,誤判率較高。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的基于圖片匹配檢測釣魚網頁的方法和相應的基于圖片匹配檢測釣魚網頁的裝置。
根據本發明的一個方面,提供了一種基于圖片匹配檢測釣魚網頁的方法,所述方法的執行基于預先建立的包含多個第一圖片和第二圖片的圖片規則庫,所述第一圖片是已知釣魚網頁的截圖,所述第二圖片是在所述第一圖片中所截取的具有釣魚網頁特征的圖片;
所述方法包括:
對瀏覽器打開的網頁進行截圖,獲取第三圖片;
計算所述第三圖片與所述圖片規則庫中所有第一圖片的相似度;
根據相似度對圖片規則庫中的所有第一圖片進行排序,按照排序后的順序選取多個第一圖片,選取的第一圖片的數量小于所述圖片規則庫中第一圖片的總數量;
將所述第三圖片與選取的第一圖片對應的第二圖片進行匹配,若選取的第一圖片對應的第二圖片中的至少一個與所述第三圖片匹配,則確定所述網頁為可疑的釣魚網頁。
根據本發明的另一方面,提供了一種基于圖片匹配檢測釣魚網頁的裝置,包括:
圖片規則庫,所述圖片規則庫包含多個第一圖片和第二圖片,所述第一圖片是已知釣魚網頁的截圖,所述第二圖片是在所述第一圖片中所截取的具有釣魚網頁特征的圖片;
獲取模塊,適于對瀏覽器打開的網頁進行截圖,獲取第三圖片;
相似度計算模塊,適于計算所述第三圖片與所述圖片規則庫中所有第一圖片的相似度;
選取模塊,適于根據相似度對圖片規則庫中的所有第一圖片進行排序,按照排序后的順序選取多個第一圖片,選取的第一圖片的數量小于所述圖片規則庫中第一圖片的總數量;
匹配模塊,適于將所述第三圖片與選取的第一圖片對應的第二圖片進行匹配,若選取的第一圖片對應的第二圖片中的至少一個與所述第三圖片匹配,則確定所述網頁為可疑的釣魚網頁。
根據本發明的提供的方案,對瀏覽器打開的網頁進行截圖,獲取第三圖片;計算所述第三圖片與所述圖片規則庫中所有第一圖片的相似度;根據相似度對圖片規則庫中的所有第一圖片進行排序,按照排序后的順序選取多個第一圖片,選取的第一圖片的數量小于所述圖片規則庫中第一圖片的總數量;將所述第三圖片與選取的第一圖片對應的第二圖片進行匹配,若選取的第一圖片對應的第二圖片中的至少一個與所述第三圖片匹配,則確定所述網頁為可疑的釣魚網頁。通過對第一圖片進行篩選,減少了后續匹配過程中將第三圖片與第二圖片匹配的計算量,加快了釣魚網頁的檢測速度,降低了資源占用率;此外,由于第二圖片具有釣魚網頁特征,因此在圖片規則庫內存在與第三圖片匹配的第二圖片的情況下,第三圖片也具有釣魚網頁的特征,基于此能夠快速并準確的判斷網頁為可疑的釣魚網頁。
上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410392300.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種空間輻射環境環境危害識別的方法
- 下一篇:一種相關搜索系統及方法





