[發明專利]生成用于識別垃圾電子郵件的啟發式規則的系統和方法在審
| 申請號: | 201911159541.8 | 申請日: | 2019-11-22 |
| 公開(公告)號: | CN111752973A | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 羅曼·A·德登諾克;德米特里·S·戈魯別夫;彼得·Y·薩爾尼科夫 | 申請(專利權)人: | 卡巴斯基實驗室股份制公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455;G06F16/2458 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 何月華 |
| 地址: | 俄羅斯*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生成 用于 識別 垃圾 電子郵件 啟發式 規則 系統 方法 | ||
本發明涉及生成用于識別垃圾電子郵件的啟發式規則的系統和方法。在一個方面中,示例性方法包括:收集并分析關于多個電子郵件的內容的統計數據,以識別內容的不同類型,內容的不同類型包括標題或超鏈接;基于識別出的內容的不同類型將所述多個電子郵件分組成簇,至少一個簇包括所述電子郵件的標題中的字段的群組;選擇各個簇中的數據的至少一個最常見的群組組合;從所述至少一個最常見的群組組合生成散列;基于對與所生成的散列相對應的超鏈接的分析而形成至少一個正則表達式;以及通過將至少一個散列與相應的正則表達式組合來生成用于識別包含垃圾信息的電子郵件的至少一個啟發式規則,其中,至少一個散列源自于所述電子郵件的標題的字段的序列。
技術領域
本發明涉及計算機安全領域,更具體地涉及識別垃圾電子郵件的系統和方法。
背景技術
目前,對提供數據安全和計算機安全的需求不斷增長。當用戶收到未經請求或不想要的內容時,安全可能會受到損害,欺詐活動可能隨之而來。發送未經請求或不想要的內容的一種方式是使用垃圾電子郵件,垃圾電子郵件是出于為特定產品或服務做廣告的目的和出于實施欺詐動作的目的而通過電子郵件發送的一種類型的電子內容。如今,有許多可用于發送垃圾電子郵件的技術。例如,可以使用代理服務器、使電子郵件以自動方式進行發送的免費電子郵件服務器、僵尸網絡等發送垃圾電子郵件。在另一示例中,可以借助即時通訊協議在社交網絡、博客、論壇、約會網站等中發送垃圾電子郵件。在又一示例中,可以使用短消息服務(Short Message Service,SMS)消息或多媒體消息服務(MultimediaMessaging Service,MMS)消息分發垃圾電子郵件。
為了說明垃圾電子郵件在現代通信中的影響,以電郵發送的垃圾電子郵件占電子郵件總容量的70%-90%。計算機網絡發送的垃圾電子郵件數量如此之大,給電子郵件用戶帶來了極大的不便。特別是,垃圾電子郵件減小了網絡帶寬,浪費了消息交換系統的資源,并且增加了用戶和計算機對電子郵件的處理時間。因此,用戶必須不斷地與垃圾電子郵件作斗爭。
已經開發出了各種機制來對抗垃圾電子郵件,諸如創建垃圾電子郵件發送者黑名單、創建需要重復訪問郵件服務器以發送垃圾電子郵件的發送者的灰名單、對垃圾電子郵件進行上下文過濾等。通常,垃圾電子郵件過濾關注于分析電子郵件消息的內容。基于過濾的方法通常需要精確匹配,以便發現包含垃圾信息的電子郵件并將包含垃圾信息的電子郵件與合法電子郵件區分開。遺憾的是,對內容的分析引入了其它問題。首先,進行大量分析需要大量時間,這會減慢電子郵件處理的速度。批量垃圾電子郵件發送進一步加劇了對處理時間的影響。其次,進行分析需要打開所有電子郵件以訪問信息。這類訪問在大多數情況下是不被允許的,除非在發送電子郵件之前取得用戶的同意。此外,在一些情況下,電子郵件可能包含機密信息。
一種提高垃圾電子郵件過濾的有效性的方法是減少大范圍的分析或引入初步分析。分析的減少可以基于對電子郵件標題的分析來代替對整個電子郵件的分析。例如,可以分析電子郵件標題和用于組成標題的標題字符。然而,基于標題分析的當前技術不包含可以同時快速分析并獲得統計上精確的結果的有效機制。例如,當發生第一類錯誤(即,誤報警)的概率大于預定閾值時,可能將合法電子郵件歸類為處于不可接受級別的垃圾電子郵件。在一些系統中,可能將被歸類為垃圾電子郵件的合法電子郵件隔離或自動刪除,而不會通知發送者和/或接收者。因此,誤分類可能導致合法電子郵件的丟失。減少誤報警的一種方式是使用不同的可以使垃圾電子郵件通過過濾器的閾值。遺憾的是,垃圾電子郵件的發送者也變得越來越富于創造力,并繼續努力考慮各種已知的垃圾電子郵件過濾機制。例如,垃圾電子郵件可以通過向電子郵件內容添加隨機化或類似于合法電子郵件的數據來避免被自動檢測到。
因此,需要改進檢測方案,例如,對用戶接收到的電子郵件采用統計數據的分析,以便有效地檢測垃圾電子郵件,同時保持電子郵件內容的機密性。即,需要在不分析包含在電子郵件正文中的文本的情況下,識別包含垃圾信息的電子郵件。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于卡巴斯基實驗室股份制公司,未經卡巴斯基實驗室股份制公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911159541.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:估算螺栓的夾緊力的方法
- 下一篇:一種學習筆記的推薦方法及電子設備





