[發明專利]一種結合機器學習的數據防泄漏策略動態更新方法及裝置有效
| 申請號: | 201810212329.2 | 申請日: | 2018-03-15 |
| 公開(公告)號: | CN108664801B | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 龔劍;喻波;王志海;魏效征;安鵬;韓振國 | 申請(專利權)人: | 北京明朝萬達科技股份有限公司 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F21/62;G06F16/35 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100097 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結合 機器 學習 數據 泄漏 策略 動態 更新 方法 裝置 | ||
1.一種結合機器學習的數據防泄漏策略動態更新方法,其特征在于,該方法包括以下步驟:
1)根據用戶輸入的敏感文檔,訓練生成機器學習策略,并在策略系統中配置一個高精度匹配閾值和一個低精度匹配閾值,并將機器學習策略下發至DLP系統;
2)當有用戶文檔向外發送時,對該用戶文檔進行敏感信息識別;
3)如果該用戶文檔和機器學習策略的匹配度等于或高于高精度匹配閾值,則阻止用戶文檔發送;
4)如果該用戶文檔和機器學習策略的匹配度低于高精度匹配閾值,但高于或等于低精度匹配閾值,則允許該用戶文檔發送,并形成文檔記錄,且通知策略管理員對該用戶文檔進行篩選;
5)根據策略管理員對用戶文檔的篩選結果確定是否更新機器學習策略;
所述步驟5)具體包括:
5.1)如果策略管理員認為該用戶文檔包含敏感信息,且符合當前機器學習的智能聚類,則將該用戶文檔發送至策略系統;
5.2)如果策略管理員認為該用戶文檔包含敏感信息,且不符合當前機器學習的智能聚類,則建立一個新類或將文檔重新歸類,并將新類名或歸類后的類名、以及用戶文檔發送至策略系統。
2.如權利要求1所述的方法,其特征在于,所述步驟5)具體包括:
5.3)如果步驟5.1)中發送至策略系統的用戶文檔,達到預定數量閾值,則策略系統匯總這些用戶文檔,并結合步驟1)輸入的敏感文檔,形成新的訓練集,更新原有機器學習策略,或者
5.4)對于步驟5.2)發送的新類名或歸類后的類名、以及用戶文檔,策略系統訓練這些新類的用戶文檔,形成新類的機器學習策略,并根據預設值,設置該機器學習策略的高/低精度匹配閾值。
3.如權利要求2所述的方法,其特征在于,所述步驟5.4)中,對發送重新歸類后的類名、以及用戶文檔,如果對于該類的用戶文檔,達到一定數量,則策略系統匯總這些用戶文檔,結合之前的訓練文檔,形成新的訓練集,并更新原有機器學習策略。
4.如權利要求1-3之一所述的方法,其特征在于,對于一類敏感文檔,訓練生成一條機器學習策略。
5.一種結合機器學習的數據防泄漏策略動態更新裝置,其特征在于,該裝置包括:機器學習策略生成模塊,根據用戶輸入的敏感文檔,訓練生成機器學習策略,并在策略系統中配置一個高精度匹配閾值和一個低精度匹配閾值,并將機器學習策略下發至DLP系統;
敏感信息識別模塊,對外發的用戶文檔進行敏感信息識別;
文檔阻止模塊,阻止和機器學習策略的匹配度等于或高于高精度匹配閾值的用戶文檔發送;文檔篩選模塊,允許和機器學習策略的匹配度低于高精度匹配閾值,但高于或等于低精度匹配閾值的用戶文檔發送,并形成文檔記錄,且通知策略管理員對該用戶文檔進行篩選;
機器學習策略更新模塊,根據策略管理員對用戶文檔的篩選結果確定是否更新機器學習策略;
所述機器學習策略更新模塊具體包括:
文檔發送子模塊,如果策略管理員認為該用戶文檔包含敏感信息,且符合當前機器學習的智能聚類,則將該用戶文檔發送至策略系統;
文檔歸類子模塊,如果策略管理員認為該用戶文檔包含敏感信息,且不符合當前機器學習的智能聚類,則建立一個新類或將文檔重新歸類,并將新類名或歸類后的類名、以及用戶文檔發送至策略系統。
6.如權利要求5所述的裝置,其特征在于,所述機器學習策略更新模塊具體包括:
第一訓練集生成子模塊,如果文檔發送子模塊發送至策略系統的用戶文檔達到預定數量閾值,則策略系統匯總這些用戶文檔,并結合用戶輸入的敏感文檔,形成新的訓練集,更新原有機器學習策略;
第二訓練集生成子模塊,對于文檔歸類子模塊發送的新類名或歸類后的類名、以及用戶文檔,策略系統訓練這些新類的用戶文檔,形成新類的機器學習策略,并設置該機器學習策略的高/低精度匹配閾值。
7.如權利要求6所述的裝置,其特征在于,第二訓練集生成子模塊,對發送的重新歸類后的類名、以及用戶文檔,如果對于該類的用戶文檔,達到預定數量閾值,則策略系統匯總這些用戶文檔,結合之前的訓練文檔,形成新的訓練集,并更新原有機器學習策略。
8.一種計算機可讀存儲介質,存儲有計算機程序指令,當執行所述計算機程序指令時,實現如權利要求1-4之一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明朝萬達科技股份有限公司,未經北京明朝萬達科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810212329.2/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





