[發明專利]垃圾郵件的識別方法及裝置有效
| 申請號: | 201710502422.2 | 申請日: | 2017-06-27 |
| 公開(公告)號: | CN107171944B | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 黃福昌;王海斌;李寧寧;李玉杰;賈小華;金永剛 | 申請(專利權)人: | 北京二六三企業通信有限公司 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 楊澤;劉芳 |
| 地址: | 100013 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 垃圾郵件 識別 方法 裝置 | ||
本發明提供一種垃圾郵件的識別方法及裝置。該垃圾郵件的識別方法,包括:接收郵件并對郵件進行解析,以獲取郵件的IP地址和郵件內容,其中郵件內容包括主題、正文和附件;通過預設校驗算法,對郵件內容進行計算,得到郵件的校驗碼;判斷郵件的校驗碼是否存在于垃圾郵件樣本中,其中,垃圾郵件樣本中存儲有不同的垃圾郵件對應的校驗碼;若郵件的校驗碼存在于垃圾郵件樣本中,則識別郵件為垃圾郵件。本發明提供的方法及裝置能夠基于垃圾郵件的行為特征對郵件進行識別,以提高垃圾郵件的識別率。
技術領域
本發明涉及垃圾郵件識別技術,尤其涉及一種垃圾郵件的識別方法及裝置。
背景技術
隨著互聯網的廣泛普及,郵件已經成為常用的通信工具之一,但用戶常會收到各種垃圾郵件,嚴重影響用戶對正常郵件的查收和處理。因此,識別垃圾郵件越來越重要。
目前基于概率統計的貝葉斯識別技術為常用的識別垃圾郵件技術,該技術會收集大量的正常郵件樣本和垃圾郵件樣本,把正常郵件樣本和垃圾郵件樣本的內容進行分詞,統計各個分詞在正常郵件樣本和垃圾郵件樣本的次數。
然而,基于概率統計的貝葉斯識別技術對于不適合分詞的垃圾信息(如圖片等)識別的效果不佳,現亟需一種識別準確率較高的識別垃圾郵件技術。
發明內容
本發明提供一種垃圾郵件的識別方法及裝置,以解決現有的基于概率統計的貝葉斯識別技術識別準確率較低的問題。
本發明提供一種垃圾郵件的識別方法,包括:
接收郵件并對所述郵件進行解析,以獲取所述郵件的IP地址和郵件內容,其中所述郵件內容包括主題、正文和附件;
通過預設校驗算法,對所述郵件內容進行計算,得到所述郵件的校驗碼;
判斷所述郵件的校驗碼是否存在于垃圾郵件樣本中,其中,所述垃圾郵件樣本中存儲有不同的垃圾郵件對應的校驗碼;
若所述郵件的校驗碼存在于所述垃圾郵件樣本中,則識別所述郵件為垃圾郵件。
可選地,若所述郵件的校驗碼不存在于所述垃圾郵件樣本中,所述方法還包括:
針對已接收到的郵件的IP值和校驗碼,判斷所述郵件的校驗碼所對應的IP地址的個數是否大于預設閥值,所述郵件的校驗碼所對應的IP地址包括與所述郵件的校驗碼相同的校驗碼所對應的已接收到的郵件的IP地址和所述郵件的IP地址;
若所述個數大于預設閾值,則識別所述郵件為垃圾郵件,并將所述郵件的校驗碼寫入到所述垃圾郵件樣本中;
若所述個數小于預設閾值,則識別所述郵件為正常郵件。
可選地,所述針對已接收到的郵件的校驗碼和IP值,判斷所述郵件的校驗碼所對應的IP地址的個數是否大于預設閥值,包括:
判斷臨時緩存中是否存儲有與所述郵件的校驗碼相同的校驗碼,所述臨時緩存中存儲有所述已接收到的郵件對應的不同的校驗碼和各所述校驗碼對應的IP地址集合;
若是,則將所述郵件的IP地址寫入到與所述郵件的校驗碼相同的校驗碼對應的IP地址集合中,并判斷所述相同的校驗碼所對應的IP地址的個數是否大于預設閥值;
若否,則將所述郵件的校驗碼和IP地址寫入到所述臨時緩存中。
可選地,所述方法還包括:
獲取所述臨時緩存中寫入校驗碼的寫入時刻距當前時刻的間隔時長;
判斷所述間隔時長是否大于預設時長;
若是,則釋放所述臨時緩存。
可選地,所述預設校驗算法包括MD5算法或SHA1算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京二六三企業通信有限公司,未經北京二六三企業通信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710502422.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種培養皿涂布輔助裝置
- 下一篇:一種高效微藻光反應裝置





