[發(fā)明專利]句法指紋識(shí)別有效
| 申請(qǐng)?zhí)枺?/td> | 201280039933.0 | 申請(qǐng)日: | 2012-07-09 |
| 公開(公告)號(hào): | CN103843003A | 公開(公告)日: | 2014-06-04 |
| 發(fā)明(設(shè)計(jì))人: | B·瓦德曼;W·哈頓克 | 申請(qǐng)(專利權(quán))人: | UAB研究基金會(huì) |
| 主分類號(hào): | G06F21/51 | 分類號(hào): | G06F21/51;G06Q10/10;H04L29/06 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會(huì)專利商標(biāo)事務(wù)所 11038 | 代理人: | 葉勇 |
| 地址: | 美國亞*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 句法 指紋識(shí)別 | ||
1.一種識(shí)別網(wǎng)絡(luò)釣魚網(wǎng)站的方法,包括:
a.提供計(jì)算機(jī)系統(tǒng),具有操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)以及用于控制通過因特網(wǎng)通信的通信系統(tǒng);
b.向計(jì)算機(jī)系統(tǒng)發(fā)送通信,包含多個(gè)疑似網(wǎng)絡(luò)釣魚URL;
c.檢索多個(gè)網(wǎng)絡(luò)釣魚URL的每個(gè)疑似網(wǎng)絡(luò)釣魚URL的網(wǎng)站內(nèi)容文件,該網(wǎng)站內(nèi)容文件包括構(gòu)造組件;
d.預(yù)處理網(wǎng)站內(nèi)容文件,從而為多個(gè)疑似網(wǎng)絡(luò)釣魚URL的每一個(gè)產(chǎn)生標(biāo)準(zhǔn)化的網(wǎng)站內(nèi)容文件集;
e.為標(biāo)準(zhǔn)化的網(wǎng)站內(nèi)容文件集的每一個(gè)創(chuàng)建抽象語法樹;
f.為每個(gè)標(biāo)準(zhǔn)化的網(wǎng)站內(nèi)容文件集的每個(gè)構(gòu)造組件計(jì)算散列值,并且為每個(gè)標(biāo)準(zhǔn)化的網(wǎng)站內(nèi)容文件集都從中構(gòu)建散列值集;
g.從第一個(gè)散列值集選擇第一個(gè)散列值并且把第一個(gè)散列值與已知網(wǎng)絡(luò)釣魚網(wǎng)站構(gòu)造組件的散列值進(jìn)行對(duì)比,以定位匹配的散列值;
h.如果匹配的散列值已定位,把第一個(gè)散列值集與匹配的散列值的散列值集進(jìn)行對(duì)比并創(chuàng)建相似度評(píng)分;以及
i.如果相似度評(píng)分達(dá)到或超過預(yù)定閾值,把導(dǎo)出第一個(gè)散列值的疑似URL指定為網(wǎng)絡(luò)釣魚網(wǎng)站。
2.根據(jù)權(quán)利要求1的方法,其中,所述通信被發(fā)送自反垃圾郵件公司、反網(wǎng)絡(luò)釣魚公司、關(guān)機(jī)公司、在客戶計(jì)算機(jī)系統(tǒng)上運(yùn)行的自治程序,該自治程序被配置為自動(dòng)地俘獲疑似網(wǎng)絡(luò)釣魚網(wǎng)站的通信并把疑似網(wǎng)絡(luò)釣魚網(wǎng)站的通信發(fā)送到所述計(jì)算機(jī)系統(tǒng)。
3.根據(jù)權(quán)利要求1的方法,其中,以電子郵件本體發(fā)送多個(gè)疑似網(wǎng)絡(luò)釣魚URL時(shí),從采用第一解析程序的通信中提取所述多個(gè)疑似網(wǎng)絡(luò)釣魚URL。
4.根據(jù)權(quán)利要求1的方法,進(jìn)一步包括在步驟c之前,從多個(gè)疑似網(wǎng)絡(luò)釣魚URL中去除以下情形的任何疑似網(wǎng)絡(luò)釣魚URL:已知有利URL、已知網(wǎng)絡(luò)釣魚URL或者所述多個(gè)疑似網(wǎng)絡(luò)釣魚URL中另一個(gè)網(wǎng)絡(luò)釣魚URL的副本的URL。
5.根據(jù)權(quán)利要求1的方法,進(jìn)一步包括在所述計(jì)算機(jī)系統(tǒng)上存儲(chǔ)網(wǎng)站內(nèi)容文件。
6.根據(jù)權(quán)利要求1的方法,其中,預(yù)處理包括一項(xiàng)或多項(xiàng)以下操作:從網(wǎng)站內(nèi)容文件中去除空格、使網(wǎng)站內(nèi)容文件不區(qū)分大小寫或者從網(wǎng)站內(nèi)容文件中去除動(dòng)態(tài)內(nèi)容。
7.根據(jù)權(quán)利要求1的方法,其中,網(wǎng)站內(nèi)容文件從所檢索的網(wǎng)站內(nèi)容文件的索引頁中導(dǎo)出。
8.根據(jù)權(quán)利要求1的方法,其中,創(chuàng)建抽象語法樹包括解析標(biāo)準(zhǔn)化的網(wǎng)站內(nèi)容文件集內(nèi)的HTML標(biāo)簽并構(gòu)建HTML實(shí)體的抽象語法樹。
9.根據(jù)權(quán)利要求1的方法,進(jìn)一步包括在所述計(jì)算機(jī)系統(tǒng)上存儲(chǔ)散列值。
10.根據(jù)權(quán)利要求1的方法,進(jìn)一步包括在所述計(jì)算機(jī)系統(tǒng)上把已知網(wǎng)絡(luò)釣魚網(wǎng)站的構(gòu)造組件的散列值存儲(chǔ)為散列值集表。
11.根據(jù)權(quán)利要求1的方法,其中,使用Kulczynski2系數(shù)計(jì)算相似度評(píng)分。
12.根據(jù)權(quán)利要求1的方法,進(jìn)一步包括相似度評(píng)分達(dá)到或超過預(yù)定閾值時(shí),把所述第一個(gè)散列值集添加到已知網(wǎng)絡(luò)釣魚網(wǎng)站構(gòu)造組件的散列值。
13.根據(jù)權(quán)利要求1的方法,其中,構(gòu)造組件是HTML標(biāo)簽。
14.根據(jù)權(quán)利要求1的方法,進(jìn)一步包括確定網(wǎng)絡(luò)釣魚網(wǎng)站的起源。
15.根據(jù)權(quán)利要求14的方法,其中,確定網(wǎng)絡(luò)釣魚網(wǎng)站的起源包括把網(wǎng)絡(luò)釣魚網(wǎng)站的散列值集與已知網(wǎng)絡(luò)釣魚網(wǎng)站的散列值集進(jìn)行對(duì)比并對(duì)每個(gè)已知網(wǎng)絡(luò)釣魚網(wǎng)站計(jì)算相似度評(píng)分。
16.根據(jù)權(quán)利要求15的方法,進(jìn)一步包括識(shí)別最高的相似度評(píng)分并把所述網(wǎng)絡(luò)釣魚網(wǎng)站與從其算出最高相似度評(píng)分的已知網(wǎng)絡(luò)釣魚網(wǎng)站聚集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于UAB研究基金會(huì),未經(jīng)UAB研究基金會(huì)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201280039933.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程





