[發明專利]面向網絡安全應用的自動化機器學習平臺以及方法在審
| 申請號: | 202211635591.0 | 申請日: | 2022-12-19 |
| 公開(公告)號: | CN116155541A | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 陳剛;鄧巧華;梁群 | 申請(專利權)人: | 中通服創發科技有限責任公司 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;G06N3/045;G06N3/08 |
| 代理公司: | 北京華專卓海知識產權代理事務所(普通合伙) 11664 | 代理人: | 張帥杰 |
| 地址: | 410000 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 網絡安全 應用 自動化 機器 學習 平臺 以及 方法 | ||
本公開的實施例提供了一種面向網絡安全應用的自動化機器學習平臺以及方法。該平臺包括:數據預處理模塊、樣本及標簽生成模塊、特征提取模塊、模型訓練模塊;數據預處理模塊,用于對流量數據進行預處理,得到用戶ID對應的行為序列;樣本及標簽生成模塊,用于根據用戶ID對應的行為序列,生成樣本及其對應的標簽;特征提取模塊,用于對樣本進行特征提取,得到樣本特征;模型訓練模塊,用于采用與樣本特征的數據格式相對應的模型結構構建初始模型,并利用樣本特征及其對應的標簽對初始模型進行訓練,得到目標模型。以此方式,可以減少用戶參與,實現機器學習自動化,進而降低用戶的使用門檻。
技術領域
本公開涉及網絡安全技術領域,尤其涉及一種面向網絡安全應用的自動化機器學習平臺以及方法。
背景技術
隨著近幾年來人工智能的飛速發展,機器學習作為人工智能的主要實現方法也得了飛速發展,各大互聯網公司紛紛推出了自己的機器學習平臺。
通過機器學習平臺,可以根據數據獲得合理的模型。利用這些模型不僅可以解決科學研究的一些問題,也可以應用到實際生活中的各個領域,積極地指導生活生產等活動。
但是,目前的機器學習平臺往往需要用戶多次參與,才可以開展模型訓練,無法做到自動化,導致用戶的使用門檻普遍較高。
發明內容
本公開提供了一種面向網絡安全應用的自動化機器學習平臺以及方法。
第一方面,本公開的實施例提供了一種面向網絡安全應用的自動化機器學習平臺,該平臺包括:數據預處理模塊、樣本及標簽生成模塊、特征提取模塊、模型訓練模塊;
數據預處理模塊,用于對流量數據進行預處理,得到用戶ID對應的行為序列;
樣本及標簽生成模塊,用于根據用戶ID對應的行為序列,生成樣本及其對應的標簽;
特征提取模塊,用于對樣本進行特征提取,得到樣本特征;
模型訓練模塊,用于采用與樣本特征的數據格式相對應的模型結構構建初始模型,并利用樣本特征及其對應的標簽對初始模型進行訓練,得到目標模型。
在第一方面的一些可實現方式中,預處理包括:用戶識別、實體識別、URL路徑標準化、行為序列提取。
在第一方面的一些可實現方式中,樣本及標簽生成模塊具體用于:
根據用戶ID對應的行為序列,生成正樣本、負樣本以及分別對應的標簽。
在第一方面的一些可實現方式中,特征提取模塊具體用于:
采用與樣本的數據類型相對應的特征提取策略,對樣本進行特征提取,得到樣本特征。
在第一方面的一些可實現方式中,模型訓練模塊具體用于:
將樣本特征及其對應的標簽隨機劃分為訓練集和測試集;
采用與樣本特征的數據格式相對應的模型結構構建具有不同超參數的初始模型;
利用訓練集對每個初始模型進行訓練,得到訓練好的多個候選模型;
利用測試集對訓練好的多個候選模型進行測試,選擇測試效果最好的候選模型作為目標模型。
在第一方面的一些可實現方式中,模型訓練模塊具體用于:
對樣本特征中的少數類樣本特征進行上采樣,生成少數類樣本特征及其對應的標簽;
將樣本特征及其對應的標簽,以及生成的少數類樣本特征及其對應的標簽隨機劃分為訓練集和測試集。
在第一方面的一些可實現方式中,該平臺還包括:模型部署模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中通服創發科技有限責任公司,未經中通服創發科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211635591.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:量化參數確定方法及裝置
- 下一篇:一種智能消防報警終端及報警方法





