[發(fā)明專利]一種基于中文分詞識(shí)別不規(guī)則垃圾短信的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201210533577.X | 申請(qǐng)日: | 2012-12-12 |
| 公開(公告)號(hào): | CN103874033B | 公開(公告)日: | 2017-11-24 |
| 發(fā)明(設(shè)計(jì))人: | 肖克華 | 申請(qǐng)(專利權(quán))人: | 上海粱江通信系統(tǒng)股份有限公司 |
| 主分類號(hào): | H04W4/14 | 分類號(hào): | H04W4/14;H04M1/725;G06F17/27 |
| 代理公司: | 上海兆豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(有限合伙)31241 | 代理人: | 章蔚強(qiáng) |
| 地址: | 200070 上海市*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 中文 分詞 識(shí)別 不規(guī)則 垃圾 短信 方法 | ||
1.一種基于中文分詞識(shí)別不規(guī)則垃圾短信的方法,其特征在于,包括下列步驟:
步驟S1,接收短信,讀取短信內(nèi)容;
步驟S2,根據(jù)短信內(nèi)容,按照從左到右的橫向排列方式,進(jìn)行中文分詞;
步驟S3,按步驟S2的中文分詞結(jié)果,記錄單詞個(gè)數(shù)W1,W1為正整數(shù),計(jì)算短信橫排權(quán)重Q1=1/(1+W1);
步驟S4,根據(jù)不規(guī)則排列短信用控制字符控制每行短信字符數(shù)的特點(diǎn),計(jì)算上述接收的短信的不規(guī)則區(qū)域,將不規(guī)則區(qū)域中的短信內(nèi)容按照豎向排列方式讀取,按照讀取的短信內(nèi)容,將上述接收的短信轉(zhuǎn)換為橫向排列的短信;
步驟S5,對(duì)步驟S4中轉(zhuǎn)換得到的短信,按照從左到右的橫向排列方式進(jìn)行中文分詞;
步驟S6,按步驟S5的中文分詞結(jié)果,記錄單詞個(gè)數(shù)W2,W2為正整數(shù),計(jì)算短信豎排權(quán)重Q2=1/(1+W2);
步驟S7,比較短信橫排權(quán)重Q1與短信豎排權(quán)重Q2,若Q1<Q2,進(jìn)入步驟S8b;若Q1>=Q2,進(jìn)入步驟S8a;
步驟S8a,判定短信為正常排列短信;
步驟S8b,判定短信為不規(guī)則排列短信,
所述步驟S4中,所述的計(jì)算上述接收的短信的不規(guī)則區(qū)域,指:計(jì)算每行字符的個(gè)數(shù),按照每行的字符個(gè)數(shù)模型,確定短信的不規(guī)則區(qū)域,
所述的每行的字符個(gè)數(shù)模型,指:等長(zhǎng)規(guī)則或者等差規(guī)則,其中,等長(zhǎng)規(guī)則指:當(dāng)前行的字符個(gè)數(shù)和上一行的字符個(gè)數(shù)相等;等差規(guī)則指:當(dāng)前行的字符個(gè)數(shù)與上一行的字符個(gè)數(shù)的差等于同一個(gè)常數(shù)。
2.根據(jù)權(quán)利要求1所述的基于中文分詞識(shí)別不規(guī)則垃圾短信的方法,其特征在于,所述的不規(guī)則排列短信包括:豎排短信、橫豎混排短信和豎排異形短信。
3.根據(jù)權(quán)利要求2所述的基于中文分詞識(shí)別不規(guī)則垃圾短信的方法,其特征在于,根據(jù)判定的短信類型,采用內(nèi)容分析匹配關(guān)鍵字,依據(jù)規(guī)則識(shí)別出是否符合關(guān)鍵字,從而識(shí)別是否為垃圾短信。
4.根據(jù)權(quán)利要求1所述的基于中文分詞識(shí)別不規(guī)則垃圾短信的方法,其特征在于,所述方法基于連接于七號(hào)信令網(wǎng)中信令鏈路的信令消息檢測(cè)處理裝置以及連接所述信令消息檢測(cè)處理裝置的業(yè)務(wù)管理中心。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海粱江通信系統(tǒng)股份有限公司,未經(jīng)上海粱江通信系統(tǒng)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210533577.X/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種回收電話線裝置
- 下一篇:一種刀具修磨加工裝置
- 同類專利
- 專利分類
H04W 無線通信網(wǎng)絡(luò)
H04W4-00 專門適用于無線通信網(wǎng)絡(luò)的業(yè)務(wù)或設(shè)施
H04W4-02 .利用用戶或終端位置的業(yè)務(wù)
H04W4-06 .廣播選擇分發(fā);到用戶組的業(yè)務(wù);單向選呼業(yè)務(wù)
H04W4-12 .消息傳送,例如SMS[短消息業(yè)務(wù)];郵箱;通告,例如,通知用戶通信請(qǐng)求的狀態(tài)或進(jìn)展
H04W4-16 .與通信相關(guān)的補(bǔ)充業(yè)務(wù),例如,呼叫轉(zhuǎn)移或呼叫保持
H04W4-18 .信息格式或內(nèi)容轉(zhuǎn)換,例如,為了向用戶或終端無線傳送的目的,由網(wǎng)絡(luò)對(duì)發(fā)送或接收的信息進(jìn)行適應(yīng)修改
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





