[發明專利]短信過濾、分類方法及系統無效
| 申請號: | 200910077123.4 | 申請日: | 2009-01-16 |
| 公開(公告)號: | CN101784022A | 公開(公告)日: | 2010-07-21 |
| 發明(設計)人: | 柳呈文 | 申請(專利權)人: | 北京炎黃新星網絡科技有限公司 |
| 主分類號: | H04W4/14 | 分類號: | H04W4/14;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100085 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 短信 過濾 分類 方法 系統 | ||
1.短信過濾、分類方法及系統,該方法包括:
步驟1,對短信文本進行預處理(關鍵字處理,黑白名單處理)。
步驟2,發送量匹配,匹配發送的內容與發送數量。
步驟3,運用“漢字正則表達式”及“詞典加詞性”方法進行詞法分詞。
步驟4,使用垃圾短信分類器的分類,運用“漢字正則表達式”定義的短信特征規則,通過改進型貝葉斯算法進行計算概率,識別垃圾/非垃圾短信。
步驟5,使用短信類型歸屬分類器的分類,對已識別的垃圾短信進行分類處理。
本發明專利在傳統垃圾短信過濾的基礎上,創新性提出基于特征的方法過濾,提高了垃圾短信識別的準確率,同時降低了垃圾短信的誤報率和漏報率。
2.如權利要求1所述說的利用短信過濾、分類方法,其特征在于,步驟1中還包括:預處理算法使用漢字正則表達式算法,對標點符號、英文、數字等處理更為靈活。
3.如權利要求1所述說的利用短信過濾、分類方法,其特征在于,步驟2中還包括:根據相同短信內容,相似短信內容,單位時間內的短信數量。
4.如權利要求1所述說的利用短信過濾、分類方法,其特征在于,步驟3中還包括:逆向匹配詞典,并使用馬爾可夫鏈進行詞性修正。
5.如權利要求1所述說的利用短信過濾、分類方法,其特征在于,步驟4中還包括:基于短信文本分詞后,提取特征向量數量的屬性。
6.如權利要求1、5所述說的利用短信過濾、分類方法,其特征在于,步驟4中還包括:基于電話號碼中的識別方法以及正則表達式。
7.如權利要求1、5、6所述說的利用短信過濾、分類方法,其特征在于,步驟4中還包括:地址、網址(單位)特征的識別方法、正則表達式內容。
8.如權利要求1、5、6、7所述說的利用短信過濾、分類方法,其特征在于,步驟4中還包括:改進型貝葉斯算法的修正算法。
9.如權利要求1所述說的利用短信過濾、分類方法,其特征在于,步驟5中還包括:垃圾短信過濾后的二次分類,進行類型歸屬。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京炎黃新星網絡科技有限公司,未經北京炎黃新星網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910077123.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種客運汽車遙控綜合報警提示器
- 下一篇:基于網絡智能無線控制系統的保險箱





