[發明專利]一種數據處理方法、裝置及設備在審
| 申請號: | 202110102757.1 | 申請日: | 2021-01-26 |
| 公開(公告)號: | CN112819156A | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 曹佳炯;丁菁汀 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N20/00 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 朱文杰 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 設備 | ||
1.一種數據處理方法,所述方法包括:
獲取聯邦學習框架中的數據提供機構提供的待檢測的目標數據;
將所述目標數據輸入到第一數據風險檢測模型中,得到第一輸出結果,并將所述目標數據輸入到第二數據風險檢測模型中,得到第二輸出結果,所述第一數據風險檢測模型為基于所述聯邦學習框架中的數據提供機構提供的第一樣本數據進行監督訓練得到,第二數據風險檢測模型為基于所述聯邦學習框架中的數據提供機構提供的第二樣本數據和所述第二樣本數據所屬的數據提供機構的機構標識通過信息重建的方式進行監督訓練得到;
如果所述第一輸出結果和所述第二輸出結果不匹配,則確定所述目標數據為包含毒素信息的數據。
2.根據權利要求1所述的方法,所述方法還包括:
當達到預定的檢測時長時,統計所述聯邦學習框架中的每個數據提供機構提供的包含毒素信息的目標數據的占比;
將統計的占比數值大于預設閾值的數據提供機構確定為異常機構。
3.根據權利要求2所述的方法,所述方法還包括:
取消使用所述異常機構提供的樣本數據進行監督訓練;或者,
從所述異常機構獲取不超過預定數量閾值的樣本數據進行監督訓練。
4.根據權利要求1所述的方法,所述目標數據包括經過加密處理的密文,所述密文為經過同態加密算法進行加密處理得到的密文或經過差分隱私算法進行差分隱私處理得到的密文,
所述獲取聯邦學習框架中的數據提供機構提供的待檢測的目標數據,包括:
通過預設的解密密鑰對所述目標數據中的密文進行解密處理,得到所述待檢測的目標數據。
5.根據權利要求1所述的方法,所述方法還包括:
從所述聯邦學習框架中的數據提供機構獲取第二樣本數據和所述第二樣本數據所屬的數據提供機構的機構標識,以及所述第二樣本數據對應的訓練標簽;
基于預設算法構建毒素檢測模型的模型架構,所述毒素檢測模型包括特征提取子模型、信息重建子模型和機構判別子模型;
通過所述第二樣本數據、所述第二樣本數據所屬的數據提供機構的機構標識和所述第二樣本數據對應的訓練標簽,以及特征提取子模型對應的損失函數、信息重建子模型對應的損失函數和機構判別子模型對應的損失函數,對所述特征提取子模型、信息重建子模型和機構判別子模型進行訓練,得到訓練后的所述毒素檢測模型;
基于訓練后的所述毒素檢測模型中包含的子模型構建所述第二數據風險檢測模型,其中,所述第二數據風險檢測模型中至少包括所述信息重建子模型。
6.根據權利要求5所述的方法,所述特征提取子模型基于ResNet網絡模型構建。
7.根據權利要求5或6所述的方法,所述信息重建子模型基于全卷積網絡FCN模型構建。
8.根據權利要求7所述的方法,所述機構判別子模型基于ResNet網絡模型構建。
9.根據權利要求8所述的方法,所述第一數據風險檢測模型中包括所述特征提取子模型,所述第二數據風險檢測模型中包括所述特征提取子模型和所述信息重建子模型。
10.根據權利要求5所述的方法,所述通過所述第二樣本數據、所述第二樣本數據所屬的數據提供機構的機構標識和所述第二樣本數據對應的訓練標簽,以及特征提取子模型對應的損失函數、信息重建子模型對應的損失函數和機構判別子模型對應的損失函數,對所述特征提取子模型、信息重建子模型和機構判別子模型進行訓練,得到訓練后的所述毒素檢測模型,包括:
基于預設的編碼規則對所述第二樣本數據所屬的數據提供機構的機構標識進行編碼,得到每個所述機構標識對應的類別標簽;
通過所述第二樣本數據、所述機構標識對應的類別標簽和所述第二樣本數據對應的訓練標簽,以及特征提取子模型對應的損失函數、信息重建子模型對應的損失函數和機構判別子模型對應的損失函數,對所述特征提取子模型、信息重建子模型和機構判別子模型進行訓練,得到訓練后的所述毒素檢測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110102757.1/1.html,轉載請聲明來源鉆瓜專利網。





