[發明專利]基于圖像處理的釣魚網頁檢測方法無效
| 申請號: | 200710130809.6 | 申請日: | 2007-08-17 |
| 公開(公告)號: | CN101145902A | 公開(公告)日: | 2008-03-19 |
| 發明(設計)人: | 曹玖新;羅軍舟;毛波 | 申請(專利權)人: | 東南大學 |
| 主分類號: | H04L9/00 | 分類號: | H04L9/00;G06T7/00;G06T5/00 |
| 代理公司: | 南京經緯專利商標代理有限公司 | 代理人: | 陸志斌 |
| 地址: | 21009*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖像 處理 釣魚 網頁 檢測 方法 | ||
1.一種基于圖像處理的釣魚網頁檢測方法,其特征在于方法具體如下:逐一計算可疑釣魚網頁與各個受保護網頁之間的相似度,將可疑網頁與受保護網頁之間的相似度小于預先設定的值的可疑網頁判為針對該受保護網頁的釣魚網頁;
上述網絡釣魚為:通過仿造網上金融或其他網絡服務提供商的相關頁面,誘導用戶輸入敏感信息,并非法取得該敏感信息的手段;
上述可疑釣魚網頁為:從可疑郵件中檢測出的鏈接地址所指向的網頁,或由用戶上報的釣魚網頁;
上述受保護網頁為:網絡釣魚所偽造的對象網頁;
上述計算網頁相似度的方法為:
步驟1,將網頁轉換為圖像;
步驟2,對所得圖像進行分割;
步驟3,提取其分割后子圖像的圖像特征;
步驟4,生成子圖像之間的相對位置關系;
步驟5,將子圖像的圖像特征和子圖像的相對位置關系組成該頁面的特征關系集合;
步驟6,計算兩個網頁的特征關系集合之間的距離并以此作為這兩個網頁的相似度,兩個網頁之間的距離小于0.02的兩個網頁為相似網頁;
其中步驟4中子圖像之間的相對位置關系由一個9維向量表示,該9維向量的每個分量表示由任一子圖像所確定的9個象限中的每個象限與另一子圖像之間的位置關系,設用于確定9個象限的任一子圖像為矩形,延長該矩形的四條邊將把圖像平面分為9個部分,從左上角開始順時針編號1~8,中心編號為9,由此形成第1~9象限,該子圖像與另一子圖像之間相對位置關系的求取方法為:只需判斷另一子圖像在該子圖像所分割的9個部分中的分布狀況,將出現全部或部分另一子圖像的象限記為1,則與該象限對應的第i維分量就為1,否則為0,根據上述方法,求出由關系矩陣表示的原網頁圖像所有子圖像之間的相對位置關系。
2.根據權利要求1所述的基于圖像處理的釣魚網頁檢測方法,其特征是:圖像分割方法由以下步驟組成:
步驟1,預處理:預處理是采用通用的坎尼算子邊界檢測方法將網頁圖像轉換為初始二值圖像;
步驟2,將預處理所得的二值圖像設為初始子圖像,置于待分割子圖像集合中(初始該集合中只有初始子圖像);
步驟3,判斷待分割子圖像集合是否為空,如果為空則結束,否則進入步驟4;
步驟4,從待分割子圖像集合中任取某個子圖像對其進行收縮處理,得到有效子圖像;
步驟5,判斷該有效子圖像是否可分割,如果可分割,檢測出該子圖像中面積最大的分割帶,并以此將該子圖像一分為二,同時把分割后的兩個子圖像存入待分割子圖像集合中,如果不能分割則將其存入以分割子圖像集合中;
步驟6,轉步驟3。
3.根據權利要求1所述的這種基于圖像處理的釣魚網頁檢測方法,其特征是:步驟3所述的圖像特征包括彩色信息,灰度信息以及長度和寬度,彩色信息和灰度信息采用直方圖統計的方法;子圖像長度和寬度直接由分割結果得到,
上述彩色信息采用直方圖獲取方法:將原圖轉換到色度純度亮度(HSV)顏色空間并將其非均勻量化為32種顏色,在此基礎上提取彩色直方圖,并對其進行歸一化處理;灰度信息采用直方圖獲取方法:將原圖轉換為黑白圖像,并對其進行拉伸,增強對比度,再將整個灰度空間量化為32個灰度,在此基礎上提取灰度直方圖,并對其進行歸一化處理。
4.根據權利要求3所述的這種基于圖像處理的釣魚網頁檢測方法,其特征是:計算兩個網頁的特征關系集合之間相似度的方法采用嵌套運土者距離方法,該嵌套運土者距離方法為:確定步驟5所述的特征關系集合中的子圖像的圖像特征的相似度,所述子圖像的圖像特征相似度的確定方法采用綜合加權距離,該綜合加權距離包括歸一化彩色直方圖相似度、歸一化灰度直方圖相似度以及長寬相似度,其權值各為1/3;確定步驟5所述的特征關系集合中的子圖像的相對位置關系的相似度,所述子圖像的相對位置關系的相似度的確定方法采用歸一化的運土者距離;最后根據子圖像的圖像特征相似度和子圖像的相對位置關系相似度,采用嵌套運土者距離計算兩個特征關系集合之間的相似度,所述嵌套運土者距離的計算方法為:首先求出所有子圖像兩兩之間的內部距離矩陣,該內部距離矩陣的大小為M×N,其中M、N為分別為兩個待檢測網頁中的子圖像的個數,內部距離矩陣的元素由前述子圖像的圖像特征相似度和子圖像的相對位置關系相似度給出,根據該內部距離矩陣,采用運土者距離算法求出子圖像之間的外部距離,所有子圖像之間的外部距離構成一個外部距離矩陣,大小為M×N,其中M、N為分別為兩個待檢測網頁中的子圖像的個數,基于該外部距離矩陣,并將兩個待檢測網頁中所有子圖像的權值設為相等,再次使用運土者距離算法求出兩個待檢測網頁的距離,該距離即為網頁的嵌套運土者距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710130809.6/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





