[發明專利]處理文本信息的方法及裝置有效
| 申請號: | 201410004140.6 | 申請日: | 2014-01-06 |
| 公開(公告)號: | CN104615585B | 公開(公告)日: | 2017-07-21 |
| 發明(設計)人: | 陳盛榮 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 廣州三環專利商標代理有限公司44202 | 代理人: | 郝傳鑫 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 處理 文本 信息 方法 裝置 | ||
技術領域
本發明涉及計算機通訊技術,尤其涉及一種處理文本信息的方法及裝置。
背景技術
隨著計算機及網絡通信技術的迅速發展,人們越來越多地通過網絡進行文本信息交流。然而,由于文本信息可以非常容易到達用戶手機等用戶終端,因此常常被利用作為廣告推廣的渠道,某些不法者甚至利用文本信息發送詐騙、色情等垃圾信息,嚴重影響和騷擾用戶的正常生活。
現有的垃圾文本信息過濾技術,主要是通過關鍵字過濾與黑白名單過濾的方法對垃圾文本信息進行過濾。然而,基于關鍵字的垃圾文本信息過濾方法,由于關鍵字很難包含所有非法信息,并且惡意用戶可通過諸如:在文本信息內容中添加大量的字符、標點符號等干擾字符的方式來回避關鍵字,從而避免被過濾。而基于黑白名單過濾的方法,由于是根據用戶來處理文本信息,假如文本信息來自白名單中的用戶,則即使該文本信息內容中包含垃圾信息,也不會被過濾。
因此,現有的垃圾文本信息過濾技術的過濾準確性不高,缺乏效率。
發明內容
有鑒于此,本發明提供一種處理文本信息的方法及裝置,可提高垃圾文本信息過濾的準確性及效率。
一種處理文本信息的方法,包括:獲取文本信息并提取所述文本信息內包括的文字字符;從所述文字字符中提取符合預定規則的目標字符;根據所述目標字符,計算所述文本信息的過濾指數;以及當所述過濾指數滿足預定條件時,對所述文本信息執行與所述預定條件對應的操作。
一種處理文本信息的裝置,包括:文字字符提取模塊,用于獲取文本信息并提取所述文本信息內包括的文字字符;目標字符提取模塊,用于從所述文字字符提取模塊提取的所述文字字符中提取符合預定規則的目標字符;計算模塊,用于根據所述目標字符提取模塊提取的所述目標字符,計算所述文本信息的過濾指數;以及處理模塊,用于當所述計算模塊計算的所述過濾指數滿足預定條件時,對所述文本信息執行與所述預定條件對應的操作。
本發明實施例提供的處理文本信息的方法及裝置,通過提取文本信息內包括的文字字符,從文字字符中提取符合預定規則的目標字符,根據目標字符計算文本信息的過濾指數,當過濾指數滿足預定條件時,對文本信息執行與預定條件對應的操作,由于是根據文本信息中符合預定規則的目標字符來計算過濾指數,因此可解決現有技術中因非法用戶在文本信息中添加大量的目標字符而導致的垃圾文本信息無法被過濾的問題,從而可提高垃圾文本信息過濾的準確性及效率。
為讓本發明的上述和其他目的、特征和優點能更明顯易懂,下文特舉較佳實施例,并配合所附圖式,作詳細說明如下。
附圖說明
圖1為本發明實施例提供的在用戶終端內進行處理文本信息的方法及裝置的應用環境圖。
圖2示出了一種用戶終端的結構框圖。
圖3為本發明第一實施例提供的在用戶終端內進行處理文本信息的方法的流程圖。
圖4為本發明第二實施例提供的在用戶終端內進行處理文本信息的方法的流程圖。
圖5為本發明第三實施例提供的處理文本信息的裝置的結構示意圖。
圖6為圖5的裝置的存儲環境示意圖。
圖7為本發明第四實施例提供的處理文本信息的裝置的結構示意圖。
圖8為本發明第四實施例提供的處理文本信息的裝置中部分模塊的結構示意圖。
圖9為本發明第四實施例提供的處理文本信息的裝置中部分模塊的結構示意圖。
具體實施方式
為更進一步闡述本發明為實現預定發明目的所采取的技術手段及功效,以下結合附圖及較佳實施例,對依據本發明的具體實施方式、結構、特征及其功效,詳細說明如后。
本發明實施例所提供的處理文本信息的方法及裝置可應用于如圖1所示的應用環境中,實現對垃圾文本信息的有效過濾。如圖1所示,多個用戶終端100之間可通過利用基站200轉發短信的方式,完成文本信息的收發??梢岳斫獾?,基站200可替代的也可為服務器,多個用戶終端100之間可以通過服務器完成文本信息的收發。
圖2示出了一種用戶終端的結構框圖。用戶終端可以包括移動電話(如:智能手機)以及其他具有用戶終端功能的計算機,例如,可以是平板電腦、PDA(Personal Digital Assistant,掌上電腦)等便攜式、袖珍式、手持式、計算機內置的或車載的移動裝置、以及臺式計算機等非移動裝置等等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410004140.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:信息處理設備以及游戲數據的數據結構
- 下一篇:一種通信方法及裝置
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





