[發(fā)明專利]反垃圾郵件網(wǎng)關(guān)系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 201110304470.3 | 申請日: | 2011-10-10 |
| 公開(公告)號: | CN102377690A | 公開(公告)日: | 2012-03-14 |
| 發(fā)明(設(shè)計)人: | 蔡瑞初;向東;熊衛(wèi)華;洪陸駕;譚景峰;喬斌;潘雷明;周達和 | 申請(專利權(quán))人: | 網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58;H04L12/24;G06F17/30 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 310012 浙江省杭州市西*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 垃圾郵件 網(wǎng)關(guān) 系統(tǒng) 方法 | ||
1.一種反垃圾郵件網(wǎng)關(guān)系統(tǒng),其包括:
郵件系統(tǒng)接口,用于從郵件傳輸代理實時獲取線上郵件并將郵件傳遞給郵件分發(fā)模塊,將在線郵件分類模塊的郵件分類結(jié)果返回給郵件傳輸代理,將離線郵件分類模塊的垃圾郵件列表返回給郵件傳輸代理;
郵件分發(fā)模塊,用于將線上郵件請求轉(zhuǎn)發(fā)給在線/離線郵件分類器,將通過各種方式反饋的郵件請求傳遞給郵件樣本收集模塊;
在線郵件分類模塊,用于根據(jù)已有的正常/垃圾郵件特征對線上郵件進行分類,并將鑒別結(jié)果實時返回給郵件傳輸代理,并按照一定時間間隔從郵件特征數(shù)據(jù)庫獲取最新的郵件特征;
離線郵件分類模塊,用于按照一定時間間隔從郵件特征數(shù)據(jù)庫獲取最新的郵件特征,使用最新提取的郵件特征對過去一段時間的緩存郵件進行分類,并將分類結(jié)果返回給郵件傳輸代理;
郵件樣本收集模塊,響應郵件分發(fā)模塊發(fā)送過來的請求,建立連接獲取郵件樣本類型及內(nèi)容;
郵件特征挖掘模塊,用于從郵件樣本數(shù)據(jù)庫中獲取郵件樣本,并從中挖掘垃圾郵件及正常郵件的特征,并將挖掘到的郵件特征通過系統(tǒng)管理員審核后進入到郵件特征數(shù)據(jù)庫;
郵件樣本數(shù)據(jù)庫,用于存儲各種郵件樣本。
2.如權(quán)利要求1所述的郵件網(wǎng)關(guān)系統(tǒng),其特征在于,郵件特征挖掘模塊還用于從郵件樣本數(shù)據(jù)庫中獲取郵件樣本,將該郵件樣本與所有的中心點進行比對,如果相似性小于一定的閾值則直接將樣本加入到該中心點,其中每個中心點為一類樣本的代表,在計算郵件樣本與中心點的相似性時,將郵件樣本與中心點分別解析為多個部分內(nèi)容,針對每個部分比較二者的相似性,根據(jù)各個部分的相似性進行加權(quán)組合獲得郵件樣本與中心點的全局相似性。
3.如權(quán)利要求2所述的郵件網(wǎng)關(guān)系統(tǒng),其特征在于,在針對每個部分比較郵件樣本和中心點的相似性時,對枚舉變量采用集合是否有交集來度量其相似性,對長文本信息及附件采用指紋計算兩者的相似性,對短文本采用Needleman-Wunsch算法確定兩者間的相似性。
4.如權(quán)利要求3所述的郵件網(wǎng)關(guān)系統(tǒng),其特征在于,當一個新的郵件樣本進入時,將該郵件樣本與所有的中心點進行比對,如果相似性小于一定的閾值則直接將樣本加入到該中心點,當聚類后一個類別中樣本超過一閾值,并且舉報為正常郵件樣本的比例少于另一閾值,則抽取該類別中心為垃圾郵件樣本。
5.如權(quán)利要求4所述的郵件網(wǎng)關(guān)系統(tǒng),其特征在于,所述系統(tǒng)進一步包括:
管理員接口,用于系統(tǒng)管理員對網(wǎng)關(guān)系統(tǒng)挖掘得到的郵件特征的人工審核確認,部分可疑郵件的審核,各種參數(shù)的設(shè)置。
6.一種反垃圾郵件方法,該方法包括步驟:
通過郵件系統(tǒng)接口從郵件傳輸代理實時獲取線上郵件并將郵件傳遞給郵件分發(fā)模塊,將在線郵件分類模塊的郵件分類結(jié)果返回給郵件傳輸代理,將離線郵件分類模塊的垃圾郵件列表返回給郵件傳輸代理;
通過郵件分發(fā)模塊將線上郵件請求轉(zhuǎn)發(fā)給在線/離線郵件分類器,并將通過各種方式反饋的郵件請求傳遞給郵件樣本收集模塊;
利用線郵件分類模塊根據(jù)已有的正常/垃圾郵件特征對線上郵件進行分類,并將鑒別結(jié)果實時返回給郵件傳輸代理,并按照一定時間間隔從郵件特征數(shù)據(jù)庫獲取最新的郵件特征;
利用離線郵件分類模塊按照一定時間間隔從郵件特征數(shù)據(jù)庫獲取最新的郵件特征,使用最新提取的郵件特征對過去一段時間的緩存郵件進行分類,并將分類結(jié)果返回給郵件傳輸代理;
通過郵件樣本收集模塊響應郵件分發(fā)模塊發(fā)送過來的請求,建立連接獲取郵件樣本類型及內(nèi)容;
通過郵件特征挖掘模塊從郵件樣本數(shù)據(jù)庫中獲取郵件樣本,并從中挖掘垃圾郵件及正常郵件的特征,并將挖掘到的郵件特征通過系統(tǒng)管理員審核后進入到郵件特征數(shù)據(jù)庫;
在郵件樣本數(shù)據(jù)庫中存儲各種郵件樣本。
7.如權(quán)利要求6所述的方法,其特征在于,郵件特征挖掘模塊還用于從郵件樣本數(shù)據(jù)庫中獲取郵件樣本,將該郵件樣本與所有的中心點進行比對,如果相似性小于一定的閾值則直接將樣本加入到該中心點,其中每個中心點為一類樣本的代表,在計算郵件樣本與中心點的相似性時,將郵件樣本與中心點分別解析為多個部分內(nèi)容,針對每個部分比較二者的相似性,根據(jù)各個部分的相似性進行加權(quán)組合獲得郵件樣本與中心點的全局相似性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司,未經(jīng)網(wǎng)易(杭州)網(wǎng)絡(luò)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110304470.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于MEGACO協(xié)議的信令代理實現(xiàn)方法
- 一種基站系統(tǒng)中的網(wǎng)關(guān)選擇方法及裝置
- 數(shù)據(jù)網(wǎng)關(guān)負載處理方法、設(shè)備及系統(tǒng)
- 網(wǎng)關(guān)、網(wǎng)關(guān)熱備份系統(tǒng)及方法
- 一種網(wǎng)關(guān)代理設(shè)置及控制方法
- 基于能力特征的網(wǎng)關(guān)管控方法及裝置
- 一種環(huán)網(wǎng)自愈的方法和裝置
- Lora網(wǎng)關(guān)控制方法及Lora通信系統(tǒng)
- 流量調(diào)度方法及裝置
- 網(wǎng)關(guān)數(shù)據(jù)的遷移方法、裝置、智能網(wǎng)關(guān)設(shè)備及存儲介質(zhì)





