[發明專利]一種電話號碼識別方法及裝置有效
| 申請號: | 201610293037.7 | 申請日: | 2016-05-05 |
| 公開(公告)號: | CN106713579B | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 盧揚;蔡超維;張華 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | H04M1/2745 | 分類號: | H04M1/2745;H04M1/665;H04M3/436 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電話號碼 識別 方法 裝置 | ||
1.一種電話號碼識別方法,其特征在于,包括:
根據預先設定的第一關鍵字數據庫中的至少一個第一關鍵字,搜索包含第一關鍵字或第一關鍵字關聯的網頁,對搜索得到的包括電話號碼和文本信息的所述網頁進行內容解析,以獲取所述網頁中的電話號碼及其對應的文本信息;
建立所述電話號碼和文本信息之間的對應關系,并存儲所述電話號碼及其對應的文本信息;
根據第一特征提取項對所述電話號碼進行特征提取,得到至少一個第一特征信息;所述第一特征提取項包括所述電話號碼的號碼歷史熱度、號碼字符串特點、號碼行為模式、所述電話號碼是否屬于黃頁、所述電話號碼是否屬于黑名單、所述電話號碼在安全客戶端的標記情況或者所述電話號碼在安全客戶端被標記為指定號碼類型的情況中的一種或者多種;其中,第一特征信息包括以下至少一項:獲取所述電話號碼在預設時間段內的通話次數;統計用戶通過安全客戶端對電話號碼進行標記的標記次數與所述安全客戶端的用戶量之間的比例;統計用戶通過所述安全客戶端將所述電話號碼標記為指定號碼類型的標記次數與用戶通過所述安全客戶端對所述電話號碼進行標記的標記次數之間的比例;
根據第二特征提取項對所述電話號碼對應的文本信息進行特征提取,得到至少一個第二特征信息;所述第二特征提取項包括所述電話號碼在搜索引擎的返回頁面結果,所述電話號碼在指定網頁被用戶提到的內容,所述電話號碼是否在指定網址頁面出現中的一種或者多種;其中,所述第二特征信息包括以下至少一項:檢測所述電話號碼對應的文本信息與預先設立的第二關鍵字數據庫中的第二關鍵字是否匹配;檢測包含所述電話號碼的其他網頁中的文本信息與所述第二關鍵字數據庫中的第二關鍵字是否匹配;檢測包含所述電話號碼的任一網頁與網頁數據庫中的網頁是否匹配;
通過機器學習,對所述第一特征信息和所述第二特征信息進行統計學習并分類,基于至少兩個維度識別所述電話號碼的號碼類型;
當用戶在呼入或者呼出所述電話號碼時,向所述安全客戶端發送風險提示信息,以使所述安全客戶端在其終端的顯示屏幕上顯示所述風險提示信息,以提示用戶所述電話號碼的號碼類型。
2.根據權利要求1所述方法,其特征在于,所述根據第一關鍵字數據庫中的第一關鍵字,搜索與所述第一關鍵字匹配的網頁,包括:
通過爬蟲模塊爬取與所述第一關鍵字匹配的網頁。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610293037.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種干擾測試方法及裝置
- 下一篇:一種電話號碼識別方法、安全服務器以及終端





