[發(fā)明專利]一種過濾國(guó)際互聯(lián)網(wǎng)絡(luò)中垃圾電子郵件的系統(tǒng)及其實(shí)現(xiàn)方法無效
| 申請(qǐng)?zhí)枺?/td> | 200610060960.2 | 申請(qǐng)日: | 2006-06-07 |
| 公開(公告)號(hào): | CN101087259A | 公開(公告)日: | 2007-12-12 |
| 發(fā)明(設(shè)計(jì))人: | 陳詩峰;李曄;馬馳騰 | 申請(qǐng)(專利權(quán))人: | 深圳市都護(hù)網(wǎng)絡(luò)科技有限公司 |
| 主分類號(hào): | H04L12/58 | 分類號(hào): | H04L12/58;G06Q10/00;H04L29/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518000廣東省深圳市福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 過濾 國(guó)際 互聯(lián)網(wǎng)絡(luò) 垃圾 電子郵件 系統(tǒng) 及其 實(shí)現(xiàn) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及個(gè)人電腦系統(tǒng)電子郵件終端、商用電子郵件服務(wù)器的垃圾郵件過濾功能。
背景技術(shù)
在互聯(lián)網(wǎng)時(shí)代,電子郵件是最簡(jiǎn)單、廉價(jià)和方便的通訊手段,它已經(jīng)成為商業(yè)和個(gè)人用戶最主要的通訊手段之一。由于其廉價(jià)和方便的特點(diǎn),令很多人利用這種渠道發(fā)送宣傳自身的廣告信件,這類廣告信件中包括了色情網(wǎng)站和賭博網(wǎng)站,還有些不法分子利用電子郵件大量散播帶有反動(dòng)內(nèi)容的信件。而這種廣告信件對(duì)絕大多數(shù)的接受者來說是沒有意義甚至是有害的,這類信件被統(tǒng)稱為垃圾郵件。現(xiàn)在垃圾信件已經(jīng)多到令人無法忍受的地步(現(xiàn)在網(wǎng)絡(luò)上傳送的郵件居然有超過70%是垃圾郵件),用戶對(duì)這些垃圾郵件不勝其煩,而運(yùn)營(yíng)商卻不得不為這些垃圾郵件所耗費(fèi)的大量的服務(wù)器資源和網(wǎng)絡(luò)資源買單。
在垃圾郵件數(shù)量不斷增加,發(fā)送手法日益高明的同時(shí),作為對(duì)抗垃圾郵件的主要方式,垃圾郵件過濾系統(tǒng)也在迅速發(fā)展,現(xiàn)在主流的垃圾郵件過濾手段有:
1、全文關(guān)鍵字檢索
全文關(guān)鍵字檢索是一種歷史悠久的過濾方式,通過郵件管理員添加被禁止的關(guān)鍵字(例如:色情),系統(tǒng)對(duì)郵件的內(nèi)容進(jìn)行分析,一旦發(fā)現(xiàn)符合的關(guān)鍵字,該郵件將被阻攔。
這種方式的有兩個(gè)缺點(diǎn):
a.很容易將正常郵件當(dāng)成垃圾郵件禁止。以剛才的關(guān)鍵字:“色情”為例,如果信件的內(nèi)容里包括“不要看色情電影”這句話,那么,這封郵件也會(huì)被阻止。這是顯而易見的錯(cuò)誤判斷。
b.真正的垃圾郵件很容易繞過關(guān)鍵字的阻礙。還是剛才那個(gè)例子:
“色情”會(huì)被拒絕,但是“色_情”就能通過驗(yàn)證,這只是一個(gè)簡(jiǎn)單的例子,還有更難以防范的,例如:用阿拉伯?dāng)?shù)字1代替英文字母l,用英文字母o代替數(shù)字0的做法,Sale變成了Sale,對(duì)于用戶而言,這兩個(gè)詞沒有分別,但是關(guān)鍵字是沒有辦法過濾的。
c.郵件全文匹配的算法復(fù)雜度隨著關(guān)鍵字的數(shù)量而線性增長(zhǎng),所以目前大部分過濾系統(tǒng)的關(guān)鍵字規(guī)則都有上限,這個(gè)缺陷不單只限制了過濾效果,而且對(duì)系統(tǒng)的穩(wěn)定性也造成了威脅。
2、行為判斷
行為判斷是根據(jù)郵件發(fā)送的行為來判斷是否垃圾郵件,例如,在1秒鐘之內(nèi),從一個(gè)客戶端發(fā)出2-3封信,如果是人手操作,不可能有這么快的速度(垃圾郵件發(fā)送者利用群發(fā)軟件發(fā)送),這種情況往往是垃圾郵件。另一種情況是:從一臺(tái)郵件服務(wù)器在一段世紀(jì)那內(nèi)大量發(fā)送郵件,這也有可能被認(rèn)為是正在發(fā)送垃圾。行為判斷也有一些缺點(diǎn):
a.隨著垃圾郵件發(fā)送技術(shù)的提高,群發(fā)軟件能夠控制速度,節(jié)奏的發(fā)送,這樣,就能有效的繞過行為模式的過濾系統(tǒng)。
b.很多垃圾郵件發(fā)送者已經(jīng)不再利用自身的郵件服務(wù)器發(fā)送垃圾,而是通過病毒控制用戶的計(jì)算機(jī),然后利用這些計(jì)算機(jī)發(fā)送,對(duì)于這種方式,行為模式也無法對(duì)付。
c.有的郵件服務(wù)器屬于大公司,本身就很繁忙,所以發(fā)送量很大,如果行為模式判斷得閥值設(shè)置過低,會(huì)將這種情況誤認(rèn)為是垃圾。如果閥值設(shè)置過高,那么,有很多垃圾郵件的發(fā)送行為又無法判斷。
3、IP黑名單
通過把垃圾郵件發(fā)送者的IP收集并列入黑名單也是一種垃圾郵件過濾辦法,但是這種方式在中國(guó)行不通。
a.因?yàn)橹袊?guó)IP資源緊缺,多數(shù)人使用的是動(dòng)態(tài)IP,所謂動(dòng)態(tài)的含義就是:這次你上網(wǎng)用的是一個(gè)IP,下次再次撥號(hào),用的就是另外一個(gè)IP了,對(duì)于這類動(dòng)態(tài)IP,無法加入黑名單。
b.很多垃圾郵件發(fā)送者已經(jīng)不再利用自身的郵件服務(wù)器發(fā)送垃圾,而是通過病毒控制用戶的計(jì)算機(jī),然后利用這些計(jì)算機(jī)發(fā)送,這種方式無法通過IP黑名單的方式解決。
4、Hash檢索
這個(gè)技術(shù)在反病毒領(lǐng)域應(yīng)用很成功,這是因?yàn)椴《緲颖镜臄?shù)量相對(duì)垃圾樣本來說少的可憐,目前最大的病毒庫(Kaspersky)的病毒數(shù)量也不超過20萬種,而垃圾樣本則不計(jì)其數(shù)。
i.Hash檢索的最大問題就是采樣的速度和數(shù)量。
ii.另外生成垃圾的HASH值得時(shí)候還需要人工確認(rèn)是否是垃圾郵件,這樣的巨大的工作量是無法交給門戶網(wǎng)站的管理員去完成的。
iii.因?yàn)槔]件很容易就可以加入干擾信息使HASH值產(chǎn)生跳躍,所以如果構(gòu)造一個(gè)HASH函數(shù)使得在有干擾的前提下,能夠產(chǎn)生相近的HASH值,從而影響過濾系統(tǒng)的過濾能力。
5.概率算法
概率算法可以認(rèn)為是Hash算法的一種特殊擴(kuò)展形式,它選用了概率函數(shù)作為Hash函數(shù),最常用的HASH函數(shù)就是全條件概率公式,即貝葉斯算法。其缺點(diǎn)非常明顯:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市都護(hù)網(wǎng)絡(luò)科技有限公司,未經(jīng)深圳市都護(hù)網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610060960.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種國(guó)際漫游代理呼叫業(yè)務(wù)的方法
- CDMA網(wǎng)國(guó)際漫游回?fù)軜I(yè)務(wù)平臺(tái)、系統(tǒng)和方法
- 軟件系統(tǒng)國(guó)際化方法和裝置
- 一種對(duì)國(guó)際詐騙電話進(jìn)行防控的方法、裝置
- 用戶界面元素國(guó)際化處理方法及裝置
- web應(yīng)用的國(guó)際化實(shí)現(xiàn)方法及國(guó)際化web開發(fā)框架
- 一種基于人形機(jī)器人的國(guó)際象棋下棋方法及人形機(jī)器人
- 軟件應(yīng)用國(guó)際化的方法、裝置和電子設(shè)備
- 虛假國(guó)際號(hào)碼識(shí)別方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 特定領(lǐng)域的國(guó)際組織影響力的量化評(píng)價(jià)方法和裝置
- 利用衛(wèi)星的互聯(lián)網(wǎng)服務(wù)系統(tǒng)
- 檢測(cè)方法、統(tǒng)計(jì)分析服務(wù)器以及檢測(cè)系統(tǒng)
- 一種基于互聯(lián)網(wǎng)絡(luò)的電子相冊(cè)
- 局域互聯(lián)網(wǎng)絡(luò)總線遠(yuǎn)程控制系統(tǒng)
- 廣電網(wǎng)絡(luò)中實(shí)現(xiàn)互聯(lián)網(wǎng)絡(luò)接入的方法、系統(tǒng)及裝置
- 用于擴(kuò)大無線互聯(lián)網(wǎng)絡(luò)的覆蓋范圍的系統(tǒng)
- 基于物聯(lián)網(wǎng)的電化學(xué)設(shè)備遠(yuǎn)程監(jiān)控預(yù)警及故障診斷系統(tǒng)
- 用于管理互聯(lián)網(wǎng)訪問連接的家庭系統(tǒng)
- 一種面向高性能計(jì)算的多FPGA互聯(lián)結(jié)構(gòu)及邏輯劃分方法
- 通訊節(jié)點(diǎn)、通訊互聯(lián)網(wǎng)絡(luò)和在其中傳輸信號(hào)的方法





