[發(fā)明專利]一種自動過濾垃圾郵件的方法及其系統(tǒng)在審
| 申請?zhí)枺?/td> | 201910406048.5 | 申請日: | 2019-05-15 |
| 公開(公告)號: | CN110149268A | 公開(公告)日: | 2019-08-20 |
| 發(fā)明(設計)人: | 倪佳歡;鄧慶慶;楊沙;何從華 | 申請(專利權)人: | 深圳市趣創(chuàng)科技有限公司 |
| 主分類號: | H04L12/58 | 分類號: | H04L12/58;G06F16/35;G06F17/27 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 馮筠 |
| 地址: | 518000 廣東省深圳市寶安區(qū)西鄉(xiāng)*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 垃圾郵件 自動過濾 貝葉斯 計算處理 接收郵件 結果分析 樣本分類 用戶提供 用戶體驗 郵件內(nèi)容 正常郵件 分類項 客戶端 分詞 概率 探針 樣本 攔截 分類 客戶 學習 | ||
本發(fā)明涉及一種自動過濾垃圾郵件的方法及其系統(tǒng);其中,自動過濾垃圾郵件的方法,包括以下步驟:S1,客戶端接收郵件;S2,對郵件內(nèi)容進行分詞操作;S3,采用樸素貝葉斯進行樣本分類;S4,計算在此項出現(xiàn)的條件下各類別出現(xiàn)的概率;若為正常郵件,則將郵件發(fā)送給客戶;若是垃圾郵件,則將郵件清理。本發(fā)明采用貝葉斯定理的概率探針判斷,通過貝葉斯分類對郵件詞集樣本的學習,計算待分類項屬于哪個類別,然后根據(jù)進行計算處理的結果分析,最終對垃圾郵件進行攔截,效果非常明顯,從而大大降低了垃圾郵件的騷擾頻率,給用戶提供最佳用戶體驗。
技術領域
本發(fā)明涉及郵件過濾方法技術領域,更具體地說是指一種自動過濾垃圾郵件的方法及其系統(tǒng)。
背景技術
互聯(lián)網(wǎng)的普及和發(fā)展,使得人們幾乎每天都會收到各種各樣的郵件,各種郵件里面有人們需要日常交流工作所需要的郵件,同時也包含了大量的垃圾郵件,這些垃圾郵件無孔不入,給用戶帶來了很多的困擾,這些垃圾郵件大多有如下特點:1、未經(jīng)接受者同意,都是在沒有事先征得郵件接收者同意的情況下單方發(fā)布;2、用戶的郵箱一般是有存儲空間上限的,頻繁的接收騷擾郵件會導致正常工作開展受到影響;3、郵件的內(nèi)容可能存在違法性,郵件可能包含有反動,迷信封建內(nèi)容,會對社會造成危害和不良影響;對于此類垃圾郵件,人們非常抵觸和反感;因此,有必要設計一種方法,可以自動形成防護,進行攔截或舉報。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術的缺陷,提供一種自動過濾垃圾郵件的方法及其系統(tǒng)。
為實現(xiàn)上述目的,本發(fā)明采用于下技術方案:
一種自動過濾垃圾郵件的方法,包括以下步驟:
S1,客戶端接收郵件;
S2,對郵件內(nèi)容進行分詞操作;
S3,采用樸素貝葉斯進行樣本分類;
S4,計算在此項出現(xiàn)的條件下各類別出現(xiàn)的概率;若為正常郵件,則將郵件發(fā)送給客戶;若是垃圾郵件,則將郵件清理。
其進一步技術方案為:所述S3之前,還包括:對樸素貝葉斯進行樣本訓練。
其進一步技術方案為:所述樸素貝葉斯的公式為:
其進一步技術方案為:所述樸素貝葉斯進行樣本訓練通過分詞去重提取出郵件中詞集,作為訓練內(nèi)容,將郵件內(nèi)容分割成由n個單詞的組合,并計算包含各組合單詞的郵件是垃圾郵件的概率。
其進一步技術方案為:當P是垃圾郵件,則:
其進一步技術方案為:獨立事件發(fā)生的概率計算公式:P(A*B)=P(A)*P(B);兩個事件互為獨立事件,兩個事件的發(fā)生沒有相關性;因此,P(單詞1、單詞2...單詞n同時出現(xiàn)|是垃圾郵件)轉換為如下公式:
P(單詞1、單詞2...單詞n同時出現(xiàn)|是垃圾郵件)
=P(單詞1|是垃圾郵件)*
P(單詞2|是垃圾郵件)*
…
P(單詞n|是垃圾郵件)*|。
一種自動過濾垃圾郵件的系統(tǒng),包括:接收單元,分詞操作單元,分類單元,及計算單元;
所述接收單元,用于客戶端接收郵件;
所述分詞操作單元,用于對郵件內(nèi)容進行分詞操作;
所述分類單元,用于采用樸素貝葉斯進行樣本分類;
所述計算單元,用于計算在此項出現(xiàn)的條件下各類別出現(xiàn)的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市趣創(chuàng)科技有限公司,未經(jīng)深圳市趣創(chuàng)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910406048.5/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 一種自主融合先驗知識的貝葉斯網(wǎng)絡方法
- 構建解決組合爆炸問題的級聯(lián)貝葉斯網(wǎng)絡的方法
- 一種可重構系統(tǒng)貝葉斯網(wǎng)構建方法
- 一種基于貝葉斯網(wǎng)絡的網(wǎng)站缺陷預測方法及其實現(xiàn)系統(tǒng)
- 應用處理方法、裝置、存儲介質(zhì)及電子設備
- 一種遮擋目標檢測方法、電子設備、存儲介質(zhì)及系統(tǒng)
- 基于貝葉斯網(wǎng)絡推理模型的犯罪重建方法及裝置
- 利用憶阻器本征噪聲實現(xiàn)貝葉斯神經(jīng)網(wǎng)絡的方法及裝置
- 基于面向對象貝葉斯網(wǎng)絡的中央空調(diào)系統(tǒng)故障診斷方法
- 一種基于貝葉斯神經(jīng)網(wǎng)絡權重約束的圖像分類方法





