[發明專利]基于業務安全的分類模型訓練方法、裝置和存儲介質有效
| 申請號: | 202010103759.8 | 申請日: | 2020-02-19 |
| 公開(公告)號: | CN111259985B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 張戎 | 申請(專利權)人: | 騰訊云計算(長沙)有限責任公司 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06N3/088;G06N3/08 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 李文淵;楊歡 |
| 地址: | 410006 湖南省長沙市岳麓區天頂街道環*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 業務 安全 分類 模型 訓練 方法 裝置 存儲 介質 | ||
1.一種基于業務安全的分類模型訓練方法,包括:
獲取目標業務的全量樣本;
根據各個樣本的樣本內容,構造各樣本的多個樣本特征,得到樣本的特征庫,并從樣本的特征庫中篩選全部或部分樣本特征構造各樣本的第一樣本特征;
通過多種異常檢測方式,分別基于各樣本對應的第一樣本特征,對所述全量樣本進行異常檢測,得到多組候選異常樣本;
根據所述多組候選異常樣本的交集或并集,從所述全量樣本中確定出異常樣本;
從所述異常樣本中篩選樣本內容滿足惡意條件的惡意樣本;
根據所述全量樣本中除去所述惡意樣本后的樣本,確定正常樣本;
根據業務需要,從所述樣本的特征庫中篩選全部或部分樣本特征,構造所述惡意樣本和所述正常樣本的第二樣本特征,進而對初始的分類模型進行訓練,得到用于對所述目標業務進行安全管控的分類模型。
2.根據權利要求1所述的方法,其特征在于,所述獲取目標業務的全量樣本,包括:
獲取預設周期內基于目標業務所產生的日志文件;
確定所述日志文件中出現的用戶賬號、及各用戶賬號對應的用戶生成內容;
將所有的用戶賬號或所有的用戶生成內容,作為所述目標業務的全量樣本。
3.根據權利要求1所述的方法,其特征在于,所述獲取目標業務的全量樣本,包括:
獲取預設周期內基于目標業務所產生的日志文件;所述日志文件包括用戶賬號、及與各所述用戶賬號對應的對象行為數據和用戶生成內容;
將所述日志文件中出現的全部的用戶賬號作為全量樣本;
所述根據各個樣本的樣本內容,構造各樣本的多個樣本特征,包括:
獲取與各所述用戶賬號分別對應的用戶描述信息;
根據各所述用戶賬號分別對應的對象行為數據、用戶生成內容和用戶描述信息,構造相應的樣本特征。
4.根據權利要求1所述的方法,其特征在于,所述獲取目標業務的全量樣本,包括:
獲取預設周期內基于目標業務所產生的日志文件;
將所述日志文件中出現的全部的用戶生成內容作為全量樣本;
所述根據各個樣本的樣本內容,構造各樣本的多個樣本特征,包括:
根據各所述用戶生成內容分別包括的惡意內容,構造相應的樣本特征。
5.根據權利要求1所述的方法,其特征在于,多種異常檢測方式中的其中一種異常檢測方式包括:
將每個樣本各自對應的第一樣本特征,分別輸入至訓練好的重構模型,得到對應的輸出向量;
基于各所述樣本分別對應的第一樣本特征和輸出向量間的差異,確定各所述樣本對應的誤差值;
將相應誤差值滿足異常條件的樣本作為候選異常樣本。
6.根據權利要求1所述的方法,其特征在于,多種異常檢測方式中的其中一種異常檢測方式包括:
基于各樣本分別對應的第一樣本特征,對所述全量樣本進行聚類處理,得到多于一類的簇;
根據各簇分別包括的樣本的第一樣本特征,確定各簇分別對應的特征均值;
基于各簇分別對應的特征均值的特征分布,從所述簇中篩選出異常簇,并將所述異常簇中的樣本作為候選異常樣本。
7.根據權利要求6所述的方法,其特征在于,所述基于各樣本分別對應的第一樣本特征,對所述全量樣本進行聚類處理,得到多于一類的簇,包括:
確定當前已存在的不同簇;
對于每個樣本,根據相應的第一樣本特征,分別計算所述樣本與當前已存在的不同簇之間的距離;
當所述距離中的最小距離小于等于距離閾值時,將所述樣本劃分至所述最小距離所對應的簇。
8.根據權利要求7所述的方法,其特征在于,所述方法還包括:
當所述距離中的最小距離大于所述距離閾值時,確定當前已存在簇的數量;
當所述數量小于預設數量時,創建新的簇,并將所述樣本劃分至新的簇;
當所述數量等于所述預設數量時,將所述樣本劃分至所述最小距離所對應的簇。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊云計算(長沙)有限責任公司,未經騰訊云計算(長沙)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010103759.8/1.html,轉載請聲明來源鉆瓜專利網。





