[發明專利]分類模型訓練、偽基站短信識別方法和裝置有效

申請號：	201710951809.6	申請日：	2017-10-13
公開（公告）號：	CN110019791B	公開（公告）日：	2022-09-20
發明（設計）人：	吳文亮	申請（專利權）人：	騰訊科技（深圳）有限公司
主分類號：	G06F16/35	分類號：	G06F16/35
代理公司：	華進聯合專利商標代理有限公司 44224	代理人：	何平;鄧云鵬
地址：	518000 廣東省深圳***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	分類模型訓練基站短信識別方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明涉及一種分類模型訓練、偽基站短信識別方法和裝置，該分類模型訓練方法包括：獲取第一樣本特征數據集；根據所述第一樣本特征數據集中的樣本特征數據訓練第一分類模型；獲取不同于所述第一樣本特征數據集的第二樣本特征數據集；通過訓練完成的第一分類模型，對所述第二樣本特征數據集中的樣本特征數據進行分類，得到分類為疑似偽基站短信類的樣本特征數據；根據分類為疑似偽基站短信類的樣本特征數據訓練用于偽基站短信分類的第二分類模型。本申請提供的方案提高了偽基站短信識別效率。

技術領域

本發明涉及計算機技術領域，特別是涉及一種分類模型訓練、偽基站短信識別方法和裝置。

背景技術

“偽基站”即假基站，主要通過短信群發器、短信發信機等相關設備，搜取以其為中心、一定半徑范圍內的手機卡信息，通過偽裝成運營商的基站，冒用他人手機號碼或短信端口號強行向用戶手機發送詐騙短信。詐騙短信比如利用欺騙性文字誘導用戶點擊釣魚網站網址、撥打特定的電話號碼或者進行銀行轉賬的短信等。

傳統技術中，主要是通過短信接收方在接收到短信時向運營商發送查詢短信，再根據運營商返回的查詢結果來識別接收到的短信是否為偽基站短信。然而傳統的這種方式，受限于信號強弱和運營商的查詢效率，導致偽基站短信識別效率較低。

發明內容

基于此，有必要針對目前偽基站短信識別效率比較低的問題，提供一種分類模型訓練方法、裝置、存儲介質和計算機設備，以及一種偽基站短信識別方法、裝置、存儲介質和計算機設備。

一種分類模型訓練方法，包括：

獲取第一樣本特征數據集；

根據所述第一樣本特征數據集中的樣本特征數據訓練第一分類模型；

獲取不同于所述第一樣本特征數據集的第二樣本特征數據集；

通過訓練完成的第一分類模型，對所述第二樣本特征數據集中的樣本特征數據進行分類，得到分類為疑似偽基站短信類的樣本特征數據；

根據分類為疑似偽基站短信類的樣本特征數據訓練用于偽基站短信分類的第二分類模型。

一種分類模型訓練裝置，包括：

第一獲取模塊，用于獲取第一樣本特征數據集；

第一訓練模塊，用于根據所述第一樣本特征數據集中的樣本特征數據訓練第一分類模型；

第二獲取模塊，用于獲取不同于所述第一樣本特征數據集的第二樣本特征數據集；

分類模塊，用于通過訓練完成的第一分類模型，對所述第二樣本特征數據集中的樣本特征數據進行分類，得到分類為疑似偽基站短信類的樣本特征數據；

第二訓練模塊，用于根據分類為疑似偽基站短信類的樣本特征數據訓練用于偽基站短信分類的第二分類模型。

一種計算機可讀存儲介質，所述計算機可讀存儲介質上存儲有計算機程序，所述計算機程序被處理器執行時，使得所述處理器執行以下步驟：

獲取第一樣本特征數據集；

根據所述第一樣本特征數據集中的樣本特征數據訓練第一分類模型；

獲取不同于所述第一樣本特征數據集的第二樣本特征數據集；

通過訓練完成的第一分類模型，對所述第二樣本特征數據集中的樣本特征數據進行分類，得到分類為疑似偽基站短信類的樣本特征數據；

根據分類為疑似偽基站短信類的樣本特征數據訓練用于偽基站短信分類的第二分類模型。

一種計算機設備，包括存儲器和處理器，所述存儲器中儲存有計算機程序，所述計算機程序被所述處理器執行時，使得所述處理器執行以下步驟：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于騰訊科技（深圳）有限公司，未經騰訊科技（深圳）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710951809.6/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：文本識別、文本監控、數據對象識別、數據處理方法
下一篇：文本分類方法及裝置和分類器模型訓練方法

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】