[發(fā)明專利]一種基于用戶反饋的垃圾郵件檢測方法無效
| 申請?zhí)枺?/td> | 201210290542.8 | 申請日: | 2012-08-16 |
| 公開(公告)號: | CN103595614A | 公開(公告)日: | 2014-02-19 |
| 發(fā)明(設(shè)計(jì))人: | 李朋飛;崔可想;耿振民;楊磊;戴偉強(qiáng) | 申請(專利權(quán))人: | 無錫華御信息技術(shù)有限公司 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58;H04L12/26;H04L29/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 214081 江蘇省無錫市濱*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 反饋 垃圾郵件 檢測 方法 | ||
1.一種基于用戶反饋的垃圾郵件檢測方法,其特征在于,該方法包括如下步驟:
S1、收集用戶反饋信息,更新垃圾郵件數(shù)據(jù)庫;
S2、接收郵件:接收全部的郵件數(shù)據(jù),分別對每一封郵件處理,轉(zhuǎn)向步驟S3;
S3、獲取發(fā)件人郵箱號及所屬郵箱服務(wù)器,并根據(jù)數(shù)據(jù)庫中可信度判斷是否為垃圾郵件制造者:
根據(jù)郵箱服務(wù)器預(yù)先設(shè)定好的可信度閾值θ,若是可信度小于θ,則轉(zhuǎn)向步驟S6;若否,則轉(zhuǎn)向步驟S4,所述可信度閾值θ一般取0.2~0.8;
S4、獲取郵件內(nèi)容的簽名:
根據(jù)郵件內(nèi)容的文本特征集,采用SIMHASH算法生成該郵件的簽名;所述SIMHASH算法的計(jì)算公式為:S=SIMHASH(MAIL_TEXT),其中SIMHASH表示SIMHASH算法,MAIL-TEXT表示郵件內(nèi)容中的文本特征集和權(quán)重信息,S為輸出的64位的郵件簽名;
S5、檢測郵件內(nèi)容是否為垃圾郵件:
根據(jù)步驟S4得到的郵件內(nèi)容簽名S,通過與數(shù)據(jù)庫中已知垃圾郵件計(jì)算漢明距離,當(dāng)簽名差距小于預(yù)先設(shè)定好的某一閾值μ時(shí),則認(rèn)為當(dāng)前郵件與已知垃圾郵件相似,從而斷定其為垃圾郵件;否則,認(rèn)為當(dāng)前郵件為正常郵件,所述μ一般取3;
S6、處理郵件:
根據(jù)前面步驟的判斷,如果當(dāng)前郵件為垃圾郵件,則根據(jù)收件人預(yù)先設(shè)定好的策略進(jìn)行處理;如果為正常郵件,則將其放入收件箱未讀郵件中。
2.根據(jù)權(quán)利要求1所述的基于用戶反饋的垃圾郵件檢測方法,其特征在于,所述的步驟S1、收集用戶反饋信息包括如下步驟:
S1.1、用戶登錄郵箱,記錄用戶對每封郵件的操作日志;
S1.2、判斷用戶對未讀郵件的操作:
當(dāng)用戶登錄郵箱后,監(jiān)聽用戶的操作,如果用戶打開了未讀郵件,則期待用戶的后續(xù)操作,轉(zhuǎn)向步驟S1.3:如果用戶刪除了未讀郵件,則認(rèn)為該郵件為垃圾郵件,轉(zhuǎn)向步驟S1.7;
S1.3、用戶是否評級:
如果用戶對郵件進(jìn)行評級,則轉(zhuǎn)向步驟S1.4;否則,則轉(zhuǎn)向步驟S1.5;
S1.4、用戶評級處理:
如果用戶給與郵件差評,則認(rèn)為是垃圾郵件,轉(zhuǎn)入步驟S1.7;否則,認(rèn)為是正常郵件,轉(zhuǎn)入步驟S1.6;
S1.5、根據(jù)用戶對該郵件的操作響應(yīng)判斷是否為垃圾郵件:
檢查當(dāng)前郵件的操作日志,如果發(fā)現(xiàn)操作順序?yàn)椤按蜷_、查閱時(shí)間過短、刪除”,則認(rèn)為當(dāng)前郵件為垃圾郵件;否則,則認(rèn)為當(dāng)前郵件為正常郵件;所述操作“查閱時(shí)間”是指查閱時(shí)間t小于預(yù)先設(shè)定好的閾值φ,所述查閱時(shí)間t是指用戶打開郵件并且活動窗口為郵件所在窗口所持續(xù)的時(shí)間,所述φ一般取0.1ms~2s;
S1.6、正常郵件處理:
檢索垃圾郵件數(shù)據(jù)庫,查看該郵件是否存在數(shù)據(jù)庫中,如果存在,好評數(shù)增加1,分別重新計(jì)算該郵件發(fā)件人、郵箱服務(wù)器和郵件內(nèi)容的可信度b;否則,則結(jié)束。所述可信度b的計(jì)算公式為:b=good/total,其中g(shù)ood為好評數(shù),total為好評數(shù)與差評數(shù)的總和。
S1.7、垃圾郵件處理:
檢索垃圾郵件數(shù)據(jù)庫,查看該郵件是否存在數(shù)據(jù)庫中,如果存在,差評數(shù)增加1,分別重新計(jì)算該郵件發(fā)件人、郵箱服務(wù)器和郵件內(nèi)容的可信度b;否則,則在垃圾郵件數(shù)據(jù)庫中添加該郵件的信息。
3.根據(jù)權(quán)利要求1所述的基于用戶反饋的垃圾郵件檢測方法,其特征在于,所述的垃圾郵件數(shù)據(jù)庫中的信息包含有:垃圾郵件發(fā)件人、垃圾郵件郵箱服務(wù)器、垃圾郵件內(nèi)容簽名以及它們各自的可信度。
4.根據(jù)權(quán)利要求1所述的基于用戶反饋的垃圾郵件檢測方法,其特征在于,所述的垃圾郵件數(shù)據(jù)庫應(yīng)能夠在可信郵件提供商間共享。
5.根據(jù)權(quán)利要求1所述的基于用戶反饋的垃圾郵件檢測方法,其特征在于,所述的垃圾郵件數(shù)據(jù)庫的更新方式應(yīng)包括本地收集用戶反饋的自我更新方式和從信任郵件服務(wù)器獲取數(shù)據(jù)的更新方式。
6.根據(jù)權(quán)利要求1所述的基于用戶反饋的垃圾郵件檢測方法,其特征在于,所述的用戶反饋包括用戶對郵件評級、打開郵件、查閱郵件時(shí)間和刪除郵件操作。
7.根據(jù)權(quán)利要求1所述的基于用戶反饋的垃圾郵件檢測方法,其特征在于,所述的用戶預(yù)先設(shè)定的策略應(yīng)包括拒收垃圾郵件和設(shè)置用戶預(yù)設(shè)可信度。
8.根據(jù)權(quán)利要求1所述的基于用戶反饋的垃圾郵件檢測方法,其特征在于,所述的用戶操作日志記錄的操作包括打開郵件、查閱時(shí)間和刪除郵件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于無錫華御信息技術(shù)有限公司,未經(jīng)無錫華御信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210290542.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:蒸汽掛燙機(jī)
- 下一篇:物料加工設(shè)備





