[發明專利]一種結合機器學習的數據防泄漏策略動態更新方法及裝置有效

申請號：	201810212329.2	申請日：	2018-03-15
公開（公告）號：	CN108664801B	公開（公告）日：	2020-07-10
發明（設計）人：	龔劍;喻波;王志海;魏效征;安鵬;韓振國	申請（專利權）人：	北京明朝萬達科技股份有限公司
主分類號：	G06F21/60	分類號：	G06F21/60;G06F21/62;G06F16/35
代理公司：	暫無信息	代理人：	暫無信息
地址：	100097 北京市海淀***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種結合機器學習數據泄漏策略動態更新方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種結合機器學習的數據防泄漏策略動態更新方法，其特征在于，該方法包括以下步驟：

1)根據用戶輸入的敏感文檔，訓練生成機器學習策略，并在策略系統中配置一個高精度匹配閾值和一個低精度匹配閾值，并將機器學習策略下發至DLP系統；

2)當有用戶文檔向外發送時，對該用戶文檔進行敏感信息識別；

3)如果該用戶文檔和機器學習策略的匹配度等于或高于高精度匹配閾值，則阻止用戶文檔發送；

4)如果該用戶文檔和機器學習策略的匹配度低于高精度匹配閾值，但高于或等于低精度匹配閾值，則允許該用戶文檔發送，并形成文檔記錄，且通知策略管理員對該用戶文檔進行篩選；

5)根據策略管理員對用戶文檔的篩選結果確定是否更新機器學習策略；

所述步驟5)具體包括：

5.1)如果策略管理員認為該用戶文檔包含敏感信息，且符合當前機器學習的智能聚類，則將該用戶文檔發送至策略系統；

5.2)如果策略管理員認為該用戶文檔包含敏感信息，且不符合當前機器學習的智能聚類，則建立一個新類或將文檔重新歸類，并將新類名或歸類后的類名、以及用戶文檔發送至策略系統。

2.如權利要求1所述的方法，其特征在于，所述步驟5)具體包括：

5.3)如果步驟5.1)中發送至策略系統的用戶文檔，達到預定數量閾值，則策略系統匯總這些用戶文檔，并結合步驟1)輸入的敏感文檔，形成新的訓練集，更新原有機器學習策略，或者

5.4)對于步驟5.2)發送的新類名或歸類后的類名、以及用戶文檔，策略系統訓練這些新類的用戶文檔，形成新類的機器學習策略，并根據預設值，設置該機器學習策略的高/低精度匹配閾值。

3.如權利要求2所述的方法，其特征在于，所述步驟5.4)中，對發送重新歸類后的類名、以及用戶文檔，如果對于該類的用戶文檔，達到一定數量，則策略系統匯總這些用戶文檔，結合之前的訓練文檔，形成新的訓練集，并更新原有機器學習策略。

4.如權利要求1-3之一所述的方法，其特征在于，對于一類敏感文檔，訓練生成一條機器學習策略。

5.一種結合機器學習的數據防泄漏策略動態更新裝置，其特征在于，該裝置包括：機器學習策略生成模塊，根據用戶輸入的敏感文檔，訓練生成機器學習策略，并在策略系統中配置一個高精度匹配閾值和一個低精度匹配閾值，并將機器學習策略下發至DLP系統；

敏感信息識別模塊，對外發的用戶文檔進行敏感信息識別；

文檔阻止模塊，阻止和機器學習策略的匹配度等于或高于高精度匹配閾值的用戶文檔發送；文檔篩選模塊，允許和機器學習策略的匹配度低于高精度匹配閾值，但高于或等于低精度匹配閾值的用戶文檔發送，并形成文檔記錄，且通知策略管理員對該用戶文檔進行篩選；

機器學習策略更新模塊，根據策略管理員對用戶文檔的篩選結果確定是否更新機器學習策略；

所述機器學習策略更新模塊具體包括：

文檔發送子模塊，如果策略管理員認為該用戶文檔包含敏感信息，且符合當前機器學習的智能聚類，則將該用戶文檔發送至策略系統；

文檔歸類子模塊，如果策略管理員認為該用戶文檔包含敏感信息，且不符合當前機器學習的智能聚類，則建立一個新類或將文檔重新歸類，并將新類名或歸類后的類名、以及用戶文檔發送至策略系統。

6.如權利要求5所述的裝置，其特征在于，所述機器學習策略更新模塊具體包括：

第一訓練集生成子模塊，如果文檔發送子模塊發送至策略系統的用戶文檔達到預定數量閾值，則策略系統匯總這些用戶文檔，并結合用戶輸入的敏感文檔，形成新的訓練集，更新原有機器學習策略；

第二訓練集生成子模塊，對于文檔歸類子模塊發送的新類名或歸類后的類名、以及用戶文檔，策略系統訓練這些新類的用戶文檔，形成新類的機器學習策略，并設置該機器學習策略的高/低精度匹配閾值。

7.如權利要求6所述的裝置，其特征在于，第二訓練集生成子模塊，對發送的重新歸類后的類名、以及用戶文檔，如果對于該類的用戶文檔，達到預定數量閾值，則策略系統匯總這些用戶文檔，結合之前的訓練文檔，形成新的訓練集，并更新原有機器學習策略。

8.一種計算機可讀存儲介質，存儲有計算機程序指令，當執行所述計算機程序指令時，實現如權利要求1-4之一所述的方法。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京明朝萬達科技股份有限公司，未經北京明朝萬達科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810212329.2/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】