[發明專利]一種信息識別方法及系統在審
| 申請號: | 201610628540.3 | 申請日: | 2016-08-03 |
| 公開(公告)號: | CN107690130A | 公開(公告)日: | 2018-02-13 |
| 發明(設計)人: | 張曉璐;江為強;高家鳳;方紹楨 | 申請(專利權)人: | 中國移動通信集團公司;中移(蘇州)軟件技術有限公司 |
| 主分類號: | H04W4/14 | 分類號: | H04W4/14;H04W12/12;G06F17/30 |
| 代理公司: | 北京派特恩知識產權代理有限公司11270 | 代理人: | 蔣雅潔,張穎玲 |
| 地址: | 100032 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 信息 識別 方法 系統 | ||
技術領域
本發明涉及通信領域中的信息安全技術,具體涉及一種信息識別方法及系統。
背景技術
隨著通信技術的不斷發展,手機使用率越來越高,相繼通過手機進行即時通信的軟件也越來越多,犯罪分子通過短信和即時消息等信息文本的方式,大量編造虛假信息并設置騙局,對受害人實施遠程、非接觸式詐騙,誘使受害人給犯罪分子打款或轉賬,如此,導致越來越多的受害人因收到詐騙信息,而上當受騙,有時財產損失巨大。詐騙信息的不斷變化,導致短信和即時消息的運營商很難精準的制定攔截策略來對詐騙信息進行管制,同時銀行和監管方也難以預防和追蹤詐騙事件的發生。
目前,業內通常通過提取短信內容,匹配短信內容與預設的正則表達式,當短信內容與預設的正則表達式匹配成功時,確定短信為不良信息。但是這種技術方案由于沒有對匹配到的信息進行初步過濾,這樣很容易造成對合法短信進行誤攔。
發明內容
為解決現有存在的技術問題,本發明實施例期望提供一種信息識別方法及系統,能夠避免對合法短信進行誤攔,同時提高了詐騙信息識別的準確率。
本發明實施例的技術方案是這樣實現的:
根據本發明實施例的一方面,提供一種信息識別方法,所述方法包括:
提取設定時間段內信息文本中攜帶的電子地址,并根據所述電子地址確定所述電子地址的特征信息;
根據所述特征信息對所述電子地址進行聚類分析,定位出疑似違規電子地址。
上述方案中,所述根據所述特征信息對所述電子地址進行聚類分析,定位出疑似違規電子地址,包括:
將所述特征信息中屬于同一類特征的電子地址聚為一類,并確定同一類特征信息中所述電子地址次數;
檢測到所述特征次數超過預設閾值時,確定所述電子地址為疑似違規電子地址。
上述方案中,所述特征信息包括:電子地址的發送/接收次數、發送/接收ID個數、發送/接收ID列表、命中關鍵字/詞個數和正常/違規電子地址個數中的一種或多種。
上述方案中,所述提取預設時間段內信息文本中攜帶的電子地址,包括:
對預設時間段內信息文本的內容進行全角字符解析轉半角字符解析處理、廣義字符映射處理、特殊字符預處理、連續字符串間最短距離處理、字符串向量有效長度判斷處理、和/或,關鍵字/或詞提取處理;
提取處理后的信息文本中攜帶的電子地址。
上述方案中,所述電子地址包括:電話號碼、銀行卡號、QQ號碼、微信號碼、郵箱地址和統一資源定位符URL中的一種或多種。
根據本發明實施例的另一方面,提供一種信息識別系統,所述系統包括:提取單元和聚類分析單元;其中,
所述提取單元,用于提取設定時間段內用戶端的信息文本中攜帶的電子地址,并根據所述電子地址確定所述電子地址的特征信息;
所述聚類分析單元,用于根據所述提取單元確定的所述特征信息對所述提取單元提取到的電子地址進行聚類分析,定位出疑似違規電子地址。
上述方案中,所述聚類分析單元,具體用于根據所述提取單元確定的所述特征信息,將屬于同一類特征的電子地址聚為一類,并確定同一類特征信息中所述電子地址次數;檢測到所述電子地址次數超過預設閾值時,確定所述電子地址為疑似違規電子地址。
上述方案中,所述特征信息包括:電子地址的發送/接收次數、發送/接收ID個數、發送/接收ID列表、命中關鍵字/詞的個數和正常/違規電子地址個數中的一種或多種。
上述方案中,所述提取單元,具體還用于對預設時間段內用戶端的信息文本內容進行全角字符解析轉半角字符解析處理、廣義字符映射處理、特殊字符預處理、連續字符串間最短距離處理、字符串向量有效長度判斷處理、和/或,關鍵字/或詞提取處理;
提取處理后的信息文本中攜帶的電子地址。
上述方案中,所述提取單元提取到的電子地址包括:電話號碼、銀行卡號、QQ號、微信號、郵箱地址和URL中的一種或多種。
本發明實施例提供一種信息識別方法及系統,通過提取設定時間段內信息文本中攜帶的電子地址,并根據所述電子地址確定所述電子地址的特征信息;根據所述特征信息對所述電子地址進行聚類分析,定位出疑似違規電子地址。如此,通過電子地址的特征信息,對電子地址進行分析過濾,能夠提高對非法信息文本的攔截準確性,同時也提高了對變化多樣的詐騙信息的識別率。
附圖說明
圖1為本發明實施例中信息識別方法的實現流程示意圖;
圖2為本發明實施例中信息識別系統的組成結構示意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團公司;中移(蘇州)軟件技術有限公司,未經中國移動通信集團公司;中移(蘇州)軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610628540.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:冷氣姿控發動機及其推力器閥島組件
- 下一篇:具有清理裝置的鋁箔包裝充填機
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





