[發(fā)明專利]垃圾短信處理方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201110003289.9 | 申請(qǐng)日: | 2011-01-10 |
| 公開(公告)號(hào): | CN102547623A | 公開(公告)日: | 2012-07-04 |
| 發(fā)明(設(shè)計(jì))人: | 樊寧;周斯寧;劉東鑫;沈軍 | 申請(qǐng)(專利權(quán))人: | 中國電信股份有限公司 |
| 主分類號(hào): | H04W4/14 | 分類號(hào): | H04W4/14;H04W12/12;G06F17/30 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會(huì)專利商標(biāo)事務(wù)所 11038 | 代理人: | 顏鏑 |
| 地址: | 100032 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 垃圾 短信 處理 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理系統(tǒng),特別是涉及一種垃圾短信處理方法和系統(tǒng)。
背景技術(shù)
隨著移動(dòng)通信的蓬勃發(fā)展,短信成為用戶基礎(chǔ)最為廣泛的移動(dòng)增值業(yè)務(wù)。然而繁榮滋生弊病,垃圾短信(即非用戶所需要的,對(duì)用戶造成騷擾的短信)泛濫使手機(jī)用戶深受其擾。用戶對(duì)垃圾短信治理有強(qiáng)烈需求。各類垃圾短信過濾系統(tǒng)應(yīng)時(shí)而生。
然而現(xiàn)有的垃圾短信過濾系統(tǒng)對(duì)垃圾短信的判定大多基于面向所有用戶統(tǒng)一的固定準(zhǔn)則。這對(duì)于不良短信、非法短信的過濾還是有顯著效果的。但對(duì)于如廣告內(nèi)容的短信,不同用戶有著不同的定義與需求,對(duì)某用戶造成騷擾的短信卻可能是另一用戶亟需的資訊。
發(fā)明內(nèi)容
本發(fā)明的目的是提出一種垃圾短信處理方法和系統(tǒng),以提供可以適應(yīng)用戶個(gè)性化過濾需求的垃圾短信過濾方案。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種垃圾短信處理方法,包括:移動(dòng)終端的垃圾短信過濾客戶端根據(jù)垃圾短信判決準(zhǔn)則將接收到的短信中的垃圾短信過濾出來;垃圾短信過濾客戶端將未能過濾出的垃圾短信反饋給垃圾短信處理平臺(tái);垃圾短信處理平臺(tái)根據(jù)反饋短信分類準(zhǔn)則對(duì)接收到的反饋短信進(jìn)行分類;垃圾短信處理平臺(tái)根據(jù)對(duì)反饋短信的分類,將不同屬性的反饋短信分別存儲(chǔ)到不同的語料庫;垃圾短信處理平臺(tái)基于語料庫建立用戶模型;通過對(duì)用戶模型的訓(xùn)練,垃圾短信處理平臺(tái)生成或更新反饋短信分類準(zhǔn)則和垃圾短信判決準(zhǔn)則;垃圾短信處理平臺(tái)將垃圾短信判決準(zhǔn)則發(fā)送給移動(dòng)終端的垃圾短信過濾客戶端。
在一個(gè)實(shí)施例中,垃圾短信處理平臺(tái)基于語料庫建立用戶模型,包括:垃圾短信處理平臺(tái)通過提取短信的分詞結(jié)構(gòu)和使用詞頻對(duì)語料庫存儲(chǔ)的短信進(jìn)行特征統(tǒng)計(jì);垃圾短信處理平臺(tái)根據(jù)對(duì)語料庫的短信的特征統(tǒng)計(jì)建立用戶模型。
在一個(gè)實(shí)施例中,通過對(duì)用戶模型的訓(xùn)練,垃圾短信處理平臺(tái)生成或更新反饋短信分類準(zhǔn)則和垃圾短信判決準(zhǔn)則,包括:垃圾短信處理平臺(tái)通過采用統(tǒng)計(jì)模式識(shí)別方法對(duì)用戶模型的訓(xùn)練選取出最優(yōu)分詞結(jié)構(gòu)和函數(shù)參數(shù);垃圾短信處理平臺(tái)根據(jù)最優(yōu)分詞結(jié)構(gòu)和函數(shù)參數(shù)生成或更新反饋短信分類準(zhǔn)則和垃圾短信判決準(zhǔn)則。
在一個(gè)實(shí)施例中,垃圾短信處理平臺(tái)根據(jù)對(duì)反饋短信的分類,將不同屬性的反饋短信分別存儲(chǔ)到不同的語料庫,包括:垃圾短信處理平臺(tái)將反饋短信分類為公用短信和個(gè)性化短信;垃圾短信處理平臺(tái)將公用短信存儲(chǔ)到所有用戶能夠共享的公用短信語料庫,將個(gè)性化短信存儲(chǔ)到網(wǎng)絡(luò)側(cè)分別為不同用戶設(shè)立的個(gè)性化語料庫。
在一個(gè)實(shí)施例中,網(wǎng)絡(luò)側(cè)分別為不同用戶設(shè)立的個(gè)性化語料庫采用用戶的移動(dòng)識(shí)別碼進(jìn)行標(biāo)識(shí)。
在一個(gè)實(shí)施例中,垃圾短信處理平臺(tái)基于語料庫建立用戶模型,包括:垃圾短信處理平臺(tái)通過提取短信的分詞結(jié)構(gòu)和使用詞頻分別對(duì)公用短信語料庫和個(gè)性化語料庫存儲(chǔ)的短信進(jìn)行特征統(tǒng)計(jì);垃圾短信處理平臺(tái)根據(jù)對(duì)公用短信語料庫的短信的特征統(tǒng)計(jì)建立用戶基本模型,根據(jù)對(duì)個(gè)性化語料庫的短信的特征統(tǒng)計(jì)建立用戶特性模型。
在一個(gè)實(shí)施例中,通過對(duì)用戶模型的訓(xùn)練,垃圾短信處理平臺(tái)生成或更新反饋短信分類準(zhǔn)則和垃圾短信判決準(zhǔn)則,包括:垃圾短信處理平臺(tái)通過采用統(tǒng)計(jì)模式識(shí)別方法對(duì)用戶基本模型的訓(xùn)練選取出第一最優(yōu)分詞結(jié)構(gòu)和函數(shù)參數(shù),根據(jù)第一最優(yōu)分詞結(jié)構(gòu)和函數(shù)參數(shù)生成或更新反饋短信分類準(zhǔn)則和垃圾短信判決基本準(zhǔn)則;垃圾短信處理平臺(tái)通過采用統(tǒng)計(jì)模式識(shí)別方法對(duì)用戶基本模型和用戶特性模型的線性聯(lián)合訓(xùn)練選取出第二最優(yōu)分詞結(jié)構(gòu)和函數(shù)參數(shù),根據(jù)第二最優(yōu)分詞結(jié)構(gòu)和函數(shù)參數(shù)生成或更新反饋短信分類準(zhǔn)則和垃圾短信個(gè)性化判決準(zhǔn)則。
在一個(gè)實(shí)施例中,垃圾短信處理平臺(tái)將垃圾短信判決準(zhǔn)則發(fā)送給移動(dòng)終端的垃圾短信過濾客戶端,包括:垃圾短信處理平臺(tái)根據(jù)用戶的定制情況,將垃圾短信判決基本準(zhǔn)則和/或垃圾短信個(gè)性化判決準(zhǔn)則發(fā)送給移動(dòng)終端垃圾短信過濾客戶端。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種垃圾短信處理系統(tǒng),包括:移動(dòng)終端的垃圾短信過濾客戶端,用于根據(jù)垃圾短信判決準(zhǔn)則將接收到的短信中的垃圾短信過濾出來,并發(fā)送反饋短信,反饋短信為所屬垃圾短信過濾客戶端未能過濾出的垃圾短信;垃圾短信處理平臺(tái),包括:接收模塊,用于接收反饋短信;分類模塊,用于根據(jù)反饋短信分類準(zhǔn)則對(duì)反饋短信進(jìn)行分類,根據(jù)對(duì)反饋短信的分類,將不同屬性的反饋短信分別存儲(chǔ)到不同的語料庫;用戶建模模塊,用于基于語料庫建立用戶模型;訓(xùn)練機(jī),用于通過對(duì)用戶模型的訓(xùn)練,生成或更新反饋短信分類準(zhǔn)則和垃圾短信判決準(zhǔn)則;發(fā)送模塊,用于將垃圾短信判決準(zhǔn)則發(fā)送給垃圾短信過濾客戶端。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國電信股份有限公司,未經(jīng)中國電信股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110003289.9/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04W 無線通信網(wǎng)絡(luò)
H04W4-00 專門適用于無線通信網(wǎng)絡(luò)的業(yè)務(wù)或設(shè)施
H04W4-02 .利用用戶或終端位置的業(yè)務(wù)
H04W4-06 .廣播選擇分發(fā);到用戶組的業(yè)務(wù);單向選呼業(yè)務(wù)
H04W4-12 .消息傳送,例如SMS[短消息業(yè)務(wù)];郵箱;通告,例如,通知用戶通信請(qǐng)求的狀態(tài)或進(jìn)展
H04W4-16 .與通信相關(guān)的補(bǔ)充業(yè)務(wù),例如,呼叫轉(zhuǎn)移或呼叫保持
H04W4-18 .信息格式或內(nèi)容轉(zhuǎn)換,例如,為了向用戶或終端無線傳送的目的,由網(wǎng)絡(luò)對(duì)發(fā)送或接收的信息進(jìn)行適應(yīng)修改
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





