[發(fā)明專利]識別垃圾短信的方法及裝置無效
| 申請?zhí)枺?/td> | 201210320796.X | 申請日: | 2012-08-31 |
| 公開(公告)號: | CN102833713A | 公開(公告)日: | 2012-12-19 |
| 發(fā)明(設(shè)計)人: | 周桂英 | 申請(專利權(quán))人: | 中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司 |
| 主分類號: | H04W4/14 | 分類號: | H04W4/14;H04W12/12 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 劉芳 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 識別 垃圾 短信 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及通信技術(shù),尤其涉及一種識別垃圾短信的方法及裝置。
背景技術(shù)
隨著手機等便攜式移動終端的普及和短信業(yè)務(wù)的迅速發(fā)展,人們越來越多地使用短信進(jìn)行通信,但是這樣伴隨而來的是日趨泛濫的垃圾短信。現(xiàn)實生活中,大量的垃圾短信通常是由專門發(fā)送垃圾短信的短信源群發(fā)的。垃圾短信不僅增加了網(wǎng)絡(luò)的負(fù)擔(dān),而且給人們的生活帶來極大的不便。
現(xiàn)有技術(shù)中,在短信中心過濾垃圾短信的方法主要是采用短信內(nèi)容分析的關(guān)鍵詞提取技術(shù)、用戶黑名單以及機器分類學(xué)習(xí)等技術(shù)。短信中心需要將各條短信的每個詞均與預(yù)設(shè)的包含垃圾詞匯的垃圾詞庫進(jìn)行比較,當(dāng)識別出某一條短信的垃圾詞匯超過預(yù)設(shè)閾值時,將該短信定義為垃圾短信,并禁止轉(zhuǎn)發(fā)。但是,這種在短信中心采用單一逐條逐字的分析方法,難于適用于海量短信的分析處理,容易造成短信中心網(wǎng)絡(luò)堵塞。
因此,需要一種方法,能夠有效識別垃圾短信。
發(fā)明內(nèi)容
本發(fā)明提供一種識別垃圾短信的方法和裝置,以有效識別垃圾短信。
本發(fā)明第一個方面提供一種識別垃圾短信的方法,包括:
獲取發(fā)送短信源號碼對應(yīng)的多條待檢測短信;
從所述待檢測短信中選取一條作為基準(zhǔn)檢驗短信,并將所述待檢測短信中除去所述基準(zhǔn)檢驗短信之外的各條短信作為待比較短信;
從所述基準(zhǔn)檢驗短信中抽取待比較詞匯;
根據(jù)所述待比較詞匯和所述待比較短信,獲取所述發(fā)送短信源號碼的內(nèi)容相似度;
當(dāng)所述內(nèi)容相似度大于第一預(yù)設(shè)閾值時,將所述發(fā)送短信源號碼對應(yīng)的所有短信識別為垃圾短信。
本發(fā)明另一個方面提供一種識別垃圾短信的裝置,包括:
獲取模塊,用于獲取發(fā)送短信源號碼對應(yīng)的多條待檢測短信;
第一抽取模塊,用于從所述待檢測短信中選取一條作為基準(zhǔn)檢驗短信,并將所述待檢測短信中除去所述基準(zhǔn)檢驗短信之外的各條短信作為待比較短信;
第二抽取模塊,用于從所述基準(zhǔn)檢驗短信中抽取待比較詞匯;
獲取內(nèi)容相似度模塊,用于根據(jù)所述待比較詞匯和所述待比較短信,獲取所述發(fā)送短信源號碼的內(nèi)容相似度;
第一判斷模塊,用于當(dāng)所述內(nèi)容相似度大于第一預(yù)設(shè)閾值時,將所述發(fā)送短信源號碼對應(yīng)的所有短信識別為垃圾短信。
由上述技術(shù)方案可知,本發(fā)明提供的識別垃圾短信的方法和裝置,通過比較同一發(fā)送短信源號碼所對應(yīng)的短信內(nèi)容,以判斷該發(fā)送短信源號碼是否發(fā)送了大量相同的短信,從而進(jìn)一步判斷該發(fā)送短信源號碼是否為專門發(fā)送垃圾短信的號碼,以有效識別垃圾短信。
附圖說明
圖1為根據(jù)本發(fā)明一實施例的識別垃圾短信的方法流程示意圖;
圖2為根據(jù)本發(fā)明另一實施例的識別垃圾短信的方法流程示意圖;
圖3為根據(jù)本發(fā)明又一實施例的識別垃圾短信的裝置結(jié)構(gòu)示意圖;
圖4為根據(jù)本發(fā)明再一實施例的識別垃圾短信的裝置結(jié)構(gòu)示意圖。
具體實施方式
本實施例一提供一種識別垃圾短信的方法,該識別垃圾短信的方法適用于現(xiàn)有的無線通信網(wǎng)絡(luò)架構(gòu),該無線通信網(wǎng)絡(luò)架構(gòu)包括短信中心,該短信中心用于識別垃圾短信,其所包括的硬件設(shè)備例如是服務(wù)器。
如圖1所示,為根據(jù)本實施例的識別垃圾短信的方法的流程示意圖,具體包括:
步驟101,獲取發(fā)送短信源號碼對應(yīng)的多條待檢測短信。
本實施例中獲取發(fā)送短信源號碼發(fā)送的待檢測短信可以為在短信中心緩存區(qū)中的短信。為了描述清楚,將使用發(fā)送短信源號碼的終端所發(fā)送的短信簡稱為該發(fā)送短信源號碼發(fā)送的短信。短信中心在接收到發(fā)送短信源號碼發(fā)送的短信時,可以存儲在緩存區(qū)中,在緩存區(qū)中的短信存滿時或緩存時間大于預(yù)設(shè)時間時,統(tǒng)計各短信的發(fā)送短信源號碼,當(dāng)某個發(fā)送短信源號碼對應(yīng)短信的數(shù)量大于預(yù)設(shè)發(fā)送數(shù)量時,該發(fā)送短信源號碼有可能發(fā)送的均是垃圾短信,此時,獲取該發(fā)送短信源號碼發(fā)送的位于緩存區(qū)中的待檢測短信并執(zhí)行后續(xù)操作以判斷該發(fā)送短信源號碼是否為專門發(fā)送垃圾短信的號碼。
這里的待檢測短信可以是緩存區(qū)內(nèi)該發(fā)送短信源號碼對應(yīng)的所有短信,也可以是該發(fā)送短信源號碼對應(yīng)的一定比例的短信,該比例例如為50%或60%。
步驟102,從待檢測短信中選取一條作為基準(zhǔn)檢驗短信,并將待檢測短信中除去基準(zhǔn)檢驗短信之外的各條短信作為待比較短信。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司,未經(jīng)中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210320796.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04W 無線通信網(wǎng)絡(luò)
H04W4-00 專門適用于無線通信網(wǎng)絡(luò)的業(yè)務(wù)或設(shè)施
H04W4-02 .利用用戶或終端位置的業(yè)務(wù)
H04W4-06 .廣播選擇分發(fā);到用戶組的業(yè)務(wù);單向選呼業(yè)務(wù)
H04W4-12 .消息傳送,例如SMS[短消息業(yè)務(wù)];郵箱;通告,例如,通知用戶通信請求的狀態(tài)或進(jìn)展
H04W4-16 .與通信相關(guān)的補充業(yè)務(wù),例如,呼叫轉(zhuǎn)移或呼叫保持
H04W4-18 .信息格式或內(nèi)容轉(zhuǎn)換,例如,為了向用戶或終端無線傳送的目的,由網(wǎng)絡(luò)對發(fā)送或接收的信息進(jìn)行適應(yīng)修改





