[發明專利]數據模型訓練方法和裝置有效
| 申請號: | 201810256461.3 | 申請日: | 2018-03-26 |
| 公開(公告)號: | CN108520181B | 公開(公告)日: | 2022-04-22 |
| 發明(設計)人: | 石佩林;王曉勇 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F21/62;G06N20/00 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 楊靜 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據模型 訓練 方法 裝置 | ||
1.一種數據模型訓練方法,包括:
獲取訓練集,所述訓練集中包括多條訓練數據;其中,所述訓練集中還包括一條或多條標記數據;
對所述訓練集進行第一隱私保護處理,得到加密訓練集;包括:對所述訓練集中的訓練數據進行第一隱私保護處理;
使用所述加密訓練集對數據模型進行訓練,得到模型參數;包括:使用所述訓練集中經過所述第一隱私保護處理的訓練數據對數據模型進行訓練;
對所述模型參數進行第二隱私保護處理,得到加密模型參數;
基于所述加密模型參數生成加密數據模型;
該方法還包括:訓練結束后,判斷所述訓練集中的標記數據的值是否發生變化,是則確定所述加密數據模型無效;
其中,所述第一隱私保護處理使得所述加密訓練集不同于所述訓練集、且所述加密訓練集與所述訓練集的訓練結果相同;
所述第二隱私保護處理使得所述加密模型參數不同于所述模型參數,且基于所述加密模型參數生成的加密數據模型與基于所述模型參數生成的數據模型在輸入相同時具有相同的輸出結果。
2.根據權利要求1所述的方法,其中:所述訓練集中的訓練數據和標記數據按照均勻分布混合。
3.根據權利要求1所述的方法,其中:所述訓練集中的訓練數據附有標記位;
所述對所述訓練集進行第一隱私保護處理,得到加密訓練集包括:對所述訓練集中的訓練數據進行第一隱私保護處理,得到多條附有標記位的加密訓練數據,組成加密訓練集;
該方法還包括:
訓練結束后,判斷所述加密訓練集中是否存在未附有標記位的數據,是則確定所述加密數據模型無效。
4.根據權利要求1所述的方法,還包括:
獲取驗證集,所述驗證集中包括一條或多條驗證數據,每條驗證數據包括適配于基于所述模型參數生成的數據模型的輸入項和輸出項;
在所述基于所述加密模型參數生成加密數據模型之后,
將所述驗證集中的各驗證數據的輸入項輸入至所述加密數據模型,統計輸出結果與相應輸出項的匹配率;
當所述匹配率高于預設閾值時,確定所述加密數據模型有效,否則確定所述加密數據模型無效。
5.根據權利要求1所述的方法,其中:
所述對所述訓練集進行第一隱私保護處理包括:根據所述訓練集,確定第一隨機分布噪聲函數;基于所述第一隨機分布噪聲函數對所述訓練集進行加噪處理;并且/或者
所述對所述模型參數進行第二隱私保護處理包括:根據所述模型參數,確定第二隨機分布噪聲函數;基于所述第二隨機分布噪聲函數對所述模型參數進行加噪處理。
6.根據權利要求5所述的方法,其中:
所述第一隨機分布噪聲函數包括以下任一項:拉普拉斯分布噪聲函數、指數分布噪聲函數、或高斯分布噪聲函數;并且/或者
所述第二隨機分布噪聲函數包括以下任一項:拉普拉斯分布噪聲函數、指數分布噪聲函數、或高斯分布噪聲函數。
7.一種數據模型訓練裝置,包括:
輸入模塊,用于獲取訓練集,所述訓練集中包括多條訓練數據;其中,所述訓練集中還包括一條或多條標記數據;
加密模塊,用于對所述訓練集進行第一隱私保護處理,得到加密訓練集;包括:對所述訓練集中的訓練數據進行第一隱私保護處理;
訓練模塊,用于使用所述加密訓練集對數據模型進行訓練,得到模型參數;包括:使用所述訓練集中經過所述第一隱私保護處理的訓練數據對數據模型進行訓練;
所述加密模塊,還用于對所述模型參數進行第二隱私保護處理,得到加密模型參數;
輸出模塊,用于基于所述加密模型參數生成加密數據模型;
該裝置還包括:
校驗模塊,用于在訓練結束后判斷所述訓練集中的標記數據的值是否發生變化,是則確定所述加密數據模型無效;
其中,所述第一隱私保護處理使得所述加密訓練集不同于所述訓練集、且所述加密訓練集與所述訓練集的訓練結果相同;
所述第二隱私保護處理使得所述加密模型參數不同于所述模型參數,且基于所述加密模型參數生成的加密數據模型與基于所述模型參數生成的數據模型在輸入相同時具有相同的輸出結果。
8.一種計算機設備,包括處理器、存儲器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如權利要求1-6中任一項所述的數據模型訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810256461.3/1.html,轉載請聲明來源鉆瓜專利網。





