[發明專利]用于基于不純數據來訓練神經網絡的方法和系統在審
| 申請號: | 202211525934.8 | 申請日: | 2022-11-30 |
| 公開(公告)號: | CN116263872A | 公開(公告)日: | 2023-06-16 |
| 發明(設計)人: | S·S·帕潘加佩 | 申請(專利權)人: | 黑莓有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06F18/241;G06F18/214 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 李興斌;吳巖琨 |
| 地址: | 加拿大*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 基于 不純 數據 訓練 神經網絡 方法 系統 | ||
本公開實施例涉及用于基于不純數據來訓練神經網絡的方法和系統。用于訓練神經網絡的方法和系統。在第一訓練階段中,使用包括信號和噪聲的第一訓練集合來訓練粗機器學習單類別分類器,以及使用排除該信號的第二訓練集合來訓練噪聲機器學習單類別分類器。將包括噪聲機器學習單類別分類器和粗機器學習單類別分類器的模型的組合應用于第一訓練集合,以創建表示第二訓練階段的信號的第三訓練集合。在第二訓練階段中,使用表示該信號的第三訓練集合來訓練最終機器學習單類別分類器。
技術領域
本申請一般涉及神經網絡,并且更具體地涉及基于不純(“impure”)數據來訓練神經網絡。
背景技術
異常檢測在許多領域中是至關重要的,包括惡意軟件檢測,視頻監控和網絡監測。
在異常檢測領域中,用于訓練神經網絡模型以檢測異常的方法通常依賴于無監督學習模型,該無監督學習模型需要用于訓練的巨大的數據集。由于在這些巨大的數據集中可能存在大量的噪聲,這些模型可能不是穩健的。此外,處理巨大的數據集還可能需要大量的計算資源。
提供增強的神經網絡模型的穩健性和用于訓練神經網絡模型的更有效的系統和方法將是有利的。
附圖說明
現在將通過示例的方式參考示出本申請的示例實施例的附圖,并且其中:
圖1示出了說明示例實施例的操作環境的示意圖;
圖2是說明圖1的計算設備的示例實施例的組件的框圖;
圖3以框圖形式示出了計算設備的示例數據設施;
圖4示意性地示出了預處理的各個階段中的訓練數據的示例;
圖5是示出其中可實現根據本描述的方法和設備的簡化示例計算設備500的框圖;
圖6示出了開發神經網絡模型的簡化示例方法的流程圖;以及
圖7示出了創建細化訓練集合的簡化示例方法的流程圖;以及
圖8示出了檢測不純數據中的信號的簡化示例方法的流程圖。
在不同的附圖中使用相似的附圖標記來表示相似的組件。
具體實施方式
在第一方面,本申請描述了一種訓練神經網絡的計算機實現的方法。該方法可以包括:在第一訓練階段中,使用包括信號和噪聲的第一訓練集合來訓練粗機器學習單類別(“one-class”)分類器;使用排除該信號的第二訓練集合來訓練噪聲機器學習單類別分類器;將包括噪聲機器學習單類別分類器和粗機器學習單類別分類器的模型的組合應用于第一訓練集合,以創建表示用于第二訓練階段的信號的第三訓練集合;以及在第二訓練階段中使用表示該信號的第三訓練集合來訓練最終機器學習單類別分類器。
在一些實現中,最終機器學習單類別分類器可以包括自動編碼器-解碼器。
在一些實現中,最終機器學習單類別分類器可以包括長短期記憶自動編碼器-解碼器。
在一些實現中,表示信號的第三訓練集合可以包括可由粗分類器檢測但不可由噪聲分類器檢測的信息。
在一些實現中,應用模型的組合可以包括標識可由粗分類器檢測但不可由噪聲分類器檢測的數據點;以及聚合所標識的數據點以創建表示信號的第三訓練集合。
在一些實現中,最終機器學習單類別分類器能夠檢測或被配置為檢測使用第一操作系統收集的信息中的信號,該第一操作系統不同于被用于收集排除該信號的第二訓練集合的第二操作系統。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于黑莓有限公司,未經黑莓有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211525934.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





