[發明專利]分類模型訓練、偽基站短信識別方法和裝置有效
| 申請號: | 201710951809.6 | 申請日: | 2017-10-13 |
| 公開(公告)號: | CN110019791B | 公開(公告)日: | 2022-09-20 |
| 發明(設計)人: | 吳文亮 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 模型 訓練 基站 短信 識別 方法 裝置 | ||
本發明涉及一種分類模型訓練、偽基站短信識別方法和裝置,該分類模型訓練方法包括:獲取第一樣本特征數據集;根據所述第一樣本特征數據集中的樣本特征數據訓練第一分類模型;獲取不同于所述第一樣本特征數據集的第二樣本特征數據集;通過訓練完成的第一分類模型,對所述第二樣本特征數據集中的樣本特征數據進行分類,得到分類為疑似偽基站短信類的樣本特征數據;根據分類為疑似偽基站短信類的樣本特征數據訓練用于偽基站短信分類的第二分類模型。本申請提供的方案提高了偽基站短信識別效率。
技術領域
本發明涉及計算機技術領域,特別是涉及一種分類模型訓練、偽基站短信識別方法和裝置。
背景技術
“偽基站”即假基站,主要通過短信群發器、短信發信機等相關設備,搜取以其為中心、一定半徑范圍內的手機卡信息,通過偽裝成運營商的基站,冒用他人手機號碼或短信端口號強行向用戶手機發送詐騙短信。詐騙短信比如利用欺騙性文字誘導用戶點擊釣魚網站網址、撥打特定的電話號碼或者進行銀行轉賬的短信等。
傳統技術中,主要是通過短信接收方在接收到短信時向運營商發送查詢短信,再根據運營商返回的查詢結果來識別接收到的短信是否為偽基站短信。然而傳統的這種方式,受限于信號強弱和運營商的查詢效率,導致偽基站短信識別效率較低。
發明內容
基于此,有必要針對目前偽基站短信識別效率比較低的問題,提供一種分類模型訓練方法、裝置、存儲介質和計算機設備,以及一種偽基站短信識別方法、裝置、存儲介質和計算機設備。
一種分類模型訓練方法,包括:
獲取第一樣本特征數據集;
根據所述第一樣本特征數據集中的樣本特征數據訓練第一分類模型;
獲取不同于所述第一樣本特征數據集的第二樣本特征數據集;
通過訓練完成的第一分類模型,對所述第二樣本特征數據集中的樣本特征數據進行分類,得到分類為疑似偽基站短信類的樣本特征數據;
根據分類為疑似偽基站短信類的樣本特征數據訓練用于偽基站短信分類的第二分類模型。
一種分類模型訓練裝置,包括:
第一獲取模塊,用于獲取第一樣本特征數據集;
第一訓練模塊,用于根據所述第一樣本特征數據集中的樣本特征數據訓練第一分類模型;
第二獲取模塊,用于獲取不同于所述第一樣本特征數據集的第二樣本特征數據集;
分類模塊,用于通過訓練完成的第一分類模型,對所述第二樣本特征數據集中的樣本特征數據進行分類,得到分類為疑似偽基站短信類的樣本特征數據;
第二訓練模塊,用于根據分類為疑似偽基站短信類的樣本特征數據訓練用于偽基站短信分類的第二分類模型。
一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時,使得所述處理器執行以下步驟:
獲取第一樣本特征數據集;
根據所述第一樣本特征數據集中的樣本特征數據訓練第一分類模型;
獲取不同于所述第一樣本特征數據集的第二樣本特征數據集;
通過訓練完成的第一分類模型,對所述第二樣本特征數據集中的樣本特征數據進行分類,得到分類為疑似偽基站短信類的樣本特征數據;
根據分類為疑似偽基站短信類的樣本特征數據訓練用于偽基站短信分類的第二分類模型。
一種計算機設備,包括存儲器和處理器,所述存儲器中儲存有計算機程序,所述計算機程序被所述處理器執行時,使得所述處理器執行以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710951809.6/2.html,轉載請聲明來源鉆瓜專利網。





