[發(fā)明專利]一種過濾垃圾郵件的方法、裝置及郵件服務(wù)器有效
| 申請?zhí)枺?/td> | 201710537313.4 | 申請日: | 2017-07-04 |
| 公開(公告)號: | CN107171948B | 公開(公告)日: | 2020-08-25 |
| 發(fā)明(設(shè)計)人: | 楊良志;劉再元;汪志新;丁德平 | 申請(專利權(quán))人: | 彩訊科技股份有限公司 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 潘登 |
| 地址: | 518000 廣東省深圳市南山區(qū)粵海街*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 過濾 垃圾郵件 方法 裝置 郵件 服務(wù)器 | ||
1.一種過濾垃圾郵件的方法,其特征在于,包括:
通過預(yù)設(shè)規(guī)則庫包括的第一規(guī)則對新接收的郵件進(jìn)行預(yù)判定,得到所述郵件的參考垃圾評分;
獲取以歷史郵件為機(jī)器學(xué)習(xí)的訓(xùn)練樣本,對所述第一規(guī)則進(jìn)行訓(xùn)練生成的第一垃圾概率值;
基于聚類算法,根據(jù)所述第一垃圾概率值計算得到所述郵件的第二垃圾概率值,其中,第一垃圾概率值包括由第一規(guī)則判定所述郵件為垃圾郵件的概率,以及由第一規(guī)則判定所述郵件為正常郵件的概率;
根據(jù)所述第二垃圾概率值的取值范圍生成對應(yīng)的聚合規(guī)則,并對所述聚合規(guī)則進(jìn)行數(shù)據(jù)挖掘得到所述聚合規(guī)則對應(yīng)的垃圾分值,其中,預(yù)先將0-1分為多個垃圾概率值區(qū)間,將每個垃圾概率值區(qū)間記為聚合規(guī)則,所述垃圾分值為正值或負(fù)值;
根據(jù)所述垃圾分值調(diào)整所述參考垃圾評分,得到所述郵件的實(shí)際垃圾評分;
將所述實(shí)際垃圾評分與預(yù)設(shè)閾值進(jìn)行比較,根據(jù)比較結(jié)果判斷所述郵件是否為垃圾郵件。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在通過預(yù)設(shè)規(guī)則庫包括的第一規(guī)則對新接收的郵件進(jìn)行預(yù)判定之前,還包括:
應(yīng)用設(shè)定的垃圾過濾技術(shù)對郵件進(jìn)行判定后生成相應(yīng)的規(guī)則,將所述垃圾過濾技術(shù)對應(yīng)的規(guī)則存入所述預(yù)設(shè)規(guī)則庫。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,在通過預(yù)設(shè)規(guī)則庫包括的第一規(guī)則對新接收的郵件進(jìn)行預(yù)判定之前,還包括:
獲取研發(fā)人員或運(yùn)維人員輸入的基于垃圾郵件的特征和發(fā)信行為的組合規(guī)則,將所述組合規(guī)則存入所述預(yù)設(shè)規(guī)則庫。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在獲取以歷史郵件為機(jī)器學(xué)習(xí)的訓(xùn)練樣本,對所述第一規(guī)則進(jìn)行訓(xùn)練生成的第一垃圾概率值之前,還包括:
在規(guī)則訓(xùn)練功能開啟時,將設(shè)定時間段內(nèi)完成判定的郵件作為機(jī)器學(xué)習(xí)訓(xùn)練的樣本,對所述第一規(guī)則進(jìn)行訓(xùn)練,生成所述第一規(guī)則對應(yīng)的第一垃圾概率,并根據(jù)所述第一垃圾概率更新原第一規(guī)則的垃圾概率數(shù)據(jù)庫。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于聚類算法,根據(jù)所述第一垃圾概率值計算得到所述郵件的第二垃圾概率值,包括:
基于貝葉斯算法,根據(jù)由第一規(guī)則判定所述郵件為垃圾郵件的概率,以及由第一規(guī)則判定所述郵件為正常郵件的概率,計算得到所述郵件的第二垃圾概率值。
6.一種過濾垃圾郵件的裝置,其特征在于,包括:
郵件預(yù)判定模塊,用于通過預(yù)設(shè)規(guī)則庫包括的第一規(guī)則對新接收的郵件進(jìn)行預(yù)判定,得到所述郵件的參考垃圾評分;
獲取模塊,用于獲取以歷史郵件為機(jī)器學(xué)習(xí)的訓(xùn)練樣本,對所述第一規(guī)則進(jìn)行訓(xùn)練生成的第一垃圾概率值;
計算模塊,用于基于聚類算法,根據(jù)所述第一垃圾概率值計算得到所述郵件的第二垃圾概率值,其中,第一垃圾概率值包括由第一規(guī)則判定所述郵件為垃圾郵件的概率,以及由第一規(guī)則判定所述郵件為正常郵件的概率;
垃圾分值確定模塊,用于根據(jù)所述第二垃圾概率值的取值范圍生成對應(yīng)的聚合規(guī)則,并對所述聚合規(guī)則進(jìn)行數(shù)據(jù)挖掘得到所述聚合規(guī)則對應(yīng)的垃圾分值,其中,預(yù)先將0-1分為多個垃圾概率值區(qū)間,將每個垃圾概率值區(qū)間記為聚合規(guī)則,所述垃圾分值為正值或負(fù)值;
垃圾郵件判斷模塊,用于根據(jù)所述垃圾分值調(diào)整所述參考垃圾評分,得到所述郵件的實(shí)際垃圾評分;
將所述實(shí)際垃圾評分與預(yù)設(shè)閾值進(jìn)行比較,根據(jù)比較結(jié)果判斷所述郵件是否為垃圾郵件。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:
規(guī)則生成模塊,用于在通過預(yù)設(shè)規(guī)則庫包括的第一規(guī)則對新接收的郵件進(jìn)行預(yù)判定之前,應(yīng)用設(shè)定的垃圾過濾技術(shù)對郵件進(jìn)行判定后生成相應(yīng)的規(guī)則,將所述垃圾過濾技術(shù)對應(yīng)的規(guī)則存入所述預(yù)設(shè)規(guī)則庫。
8.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,還包括:
規(guī)則獲取模塊,用于在通過預(yù)設(shè)規(guī)則庫包括的第一規(guī)則對新接收的郵件進(jìn)行預(yù)判定之前,獲取研發(fā)人員或運(yùn)維人員輸入的基于垃圾郵件的特征和發(fā)信行為的組合規(guī)則,將所述組合規(guī)則存入所述預(yù)設(shè)規(guī)則庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于彩訊科技股份有限公司,未經(jīng)彩訊科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710537313.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





