[發(fā)明專利]一種在聯(lián)邦學習場景下的數(shù)據(jù)集劃分方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011455586.2 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112686388A | 公開(公告)日: | 2021-04-20 |
| 發(fā)明(設(shè)計)人: | 蘇新鐸;陳建良;田豐;陳光;戴晶幗;王丹丹 | 申請(專利權(quán))人: | 廣州廣電運通金融電子股份有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 杭州創(chuàng)智卓英知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 33324 | 代理人: | 唐超文 |
| 地址: | 510000 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 聯(lián)邦 學習 場景 數(shù)據(jù) 劃分 方法 系統(tǒng) | ||
1.一種在聯(lián)邦學習場景下的數(shù)據(jù)集劃分方法,其特征在于,包括如下步驟:
步驟S1,判斷各聯(lián)邦學習參與方提供的原始數(shù)據(jù)的數(shù)據(jù)分布是否一致;
步驟S2,使用各所述聯(lián)邦學習參與方提供的數(shù)據(jù)分布一致的所述原始數(shù)據(jù)以及模型測試數(shù)據(jù)訓練、使用驗證集優(yōu)化得到最優(yōu)的聯(lián)邦分類模型M1;
步驟S3,將歸屬于各所述聯(lián)邦學習參與方的所述原始數(shù)據(jù)輸入到所述聯(lián)邦分類模型M1中,所述聯(lián)邦分類模型M1輸出模型輸入數(shù)據(jù)為所述模型測試數(shù)據(jù)的概率;
步驟S4,按照預(yù)測概率由高到低選取指定數(shù)量的所述模型輸入數(shù)據(jù)劃分為數(shù)據(jù)歸屬的所述聯(lián)邦學習參與方提供的用于驗證模型性能的驗證集,剩余的所述模型輸入數(shù)據(jù)劃分為數(shù)據(jù)歸屬的所述聯(lián)邦學習參與方提供的用于訓練模型的訓練集。
2.根據(jù)權(quán)利要求1所述的在聯(lián)邦學習場景下的數(shù)據(jù)集劃分方法,其特征在于,所述步驟S1中,判斷各所述聯(lián)邦學習參與方提供的所述原始數(shù)據(jù)的數(shù)據(jù)分布是否一致的方法具體包括:
步驟S11,將所述聯(lián)邦學習參與方提供的所述原始數(shù)據(jù)劃分為與所述原始數(shù)據(jù)的數(shù)據(jù)分布一致的訓練集、驗證集和測試集;
步驟S12,為劃分的分屬于各所述聯(lián)邦學習參與方的訓練集、驗證集賦予相對應(yīng)的數(shù)據(jù)標簽;
步驟S13,使用帶有數(shù)據(jù)標簽的分屬于各所述聯(lián)邦學習參與方的所述訓練集訓練、使用驗證集優(yōu)化得到最優(yōu)的聯(lián)邦分類模型M2;
步驟S14,將分屬于各所述聯(lián)邦學習參與方的所述測試集輸入到所述聯(lián)邦分類模型M2中,得到所述聯(lián)邦分類模型M2區(qū)分各歸屬方輸入數(shù)據(jù)的若干個本地性能評價指標;
步驟S15,對所述聯(lián)邦分類模型M2為區(qū)分輸入數(shù)據(jù)歸屬方得到的各所述本地性能評價指標的值進行聚合計算,得到一全局評價指標值,并根據(jù)所述全局評價指標值判斷出各所述聯(lián)邦學習參與方分別提供的所述原始數(shù)據(jù)的數(shù)據(jù)分布是否一致。
3.一種在聯(lián)邦學習場景下的數(shù)據(jù)集劃分系統(tǒng),可實現(xiàn)如權(quán)利要求1或2任意一項所述的數(shù)據(jù)集劃分方法,其特征在于,所述數(shù)據(jù)集劃分系統(tǒng)包括:
數(shù)據(jù)分布一致性判斷模塊,用于判斷各聯(lián)邦學習參與方提供的原始數(shù)據(jù)的數(shù)據(jù)分布是否一致;
數(shù)據(jù)標簽賦予模塊,用于為數(shù)據(jù)分布一致的各所述聯(lián)邦學習參與方提供的所述原始數(shù)據(jù)賦予相對應(yīng)的數(shù)據(jù)標簽并存儲,并為模型測試數(shù)據(jù)賦予相對應(yīng)的數(shù)據(jù)標簽并存儲;
數(shù)據(jù)獲取模塊,連接所述數(shù)據(jù)標簽賦予模塊,用于獲取經(jīng)標簽賦予后的的所述原始數(shù)據(jù)作為模型訓練樣本,獲取所述模型測試數(shù)據(jù)作為模型驗證樣本;
M1聯(lián)邦分類模型訓練模塊,連接所述數(shù)據(jù)獲取模塊,用于使用獲取的各所述聯(lián)邦學習參與方提供的所述原始數(shù)據(jù)和所述模型測試數(shù)據(jù)訓練,使用驗證集優(yōu)化得到最優(yōu)的聯(lián)邦分類模型M1;
M1模型性能測試模塊,分別連接所述數(shù)據(jù)獲取模塊和所述M1聯(lián)邦分類模型訓練模塊,用于將獲取的歸屬于各所述聯(lián)邦學習參與方的所述原始數(shù)據(jù)輸入到所述聯(lián)邦分類模型M1中,所述聯(lián)邦分類模型M1輸出模型輸入數(shù)據(jù)為所述模型測試數(shù)據(jù)的概率;
驗證集選定模塊,連接所述M1模型性能測試模塊和所述數(shù)據(jù)獲取模塊,用于按照預(yù)測概率由高到低選取指定數(shù)量的所述模型輸入數(shù)據(jù)作為數(shù)據(jù)歸屬的所述聯(lián)邦學習參與方提供的用于驗證模型性能的驗證集,剩余的所述模型輸入數(shù)據(jù)作為數(shù)據(jù)歸屬的所述聯(lián)邦學習參與方提供的用于訓練模型的訓練集。
4.根據(jù)權(quán)利要求3所述的在聯(lián)邦學習場景下的數(shù)據(jù)集劃分系統(tǒng),其特征在于,所述數(shù)據(jù)分布一致性判斷模塊中具體包括:
數(shù)據(jù)劃分單元,用于將各所述聯(lián)邦學習參與方提供的所述原始數(shù)據(jù)劃分為與所述原始數(shù)據(jù)的數(shù)據(jù)分布一致的訓練集、驗證集和測試集;
數(shù)據(jù)標簽賦予單元,連接所述數(shù)據(jù)劃分單元,用于為劃分的分屬于各所述聯(lián)邦學習參與方的訓練集、驗證集賦予相對應(yīng)的數(shù)據(jù)標簽,并為所述模型測試數(shù)據(jù)賦予相對應(yīng)的數(shù)據(jù)標簽;
M2聯(lián)邦分類模型訓練單元,連接所述數(shù)據(jù)標簽賦予單元,用于使用帶有數(shù)據(jù)標簽的分屬于各所述聯(lián)邦學習參與方的所述訓練集訓練、使用驗證集優(yōu)化得到最優(yōu)的聯(lián)邦分類模型M2;
M2模型性能測試單元,分別連接所述數(shù)據(jù)劃分單元和所述M2聯(lián)邦分類模型訓練單元,用于將分屬于各所述聯(lián)邦學習參與方的所述測試集輸入到所述聯(lián)邦分類模型M2中,得到所述聯(lián)邦分類模型M2區(qū)分各歸屬方輸入數(shù)據(jù)的若干個本地性能評價指標;
數(shù)值聚合計算單元,連接所述M2模型性能測試單元,用于對所述聯(lián)邦分類模型M2為區(qū)分輸入數(shù)據(jù)歸屬方得到的各所述本地性能評價指標的值進行聚合計算,得到一全局評價指標值;
數(shù)據(jù)分布一致性判斷單元,連接所述數(shù)值聚合計算單元,用于根據(jù)所述全局評價指標值,判斷出各所述聯(lián)邦學習參與方分別提供的所述原始數(shù)據(jù)的數(shù)據(jù)分布是否一致。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州廣電運通金融電子股份有限公司,未經(jīng)廣州廣電運通金融電子股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011455586.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種Agent聯(lián)邦快速設(shè)計流程建模方法
- 基于聯(lián)邦模式的動態(tài)產(chǎn)品協(xié)同開發(fā)平臺及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動態(tài)部署分配方法
- 聯(lián)邦學習方法、系統(tǒng)、終端設(shè)備及存儲介質(zhì)
- 一種混合聯(lián)邦學習方法及架構(gòu)
- 聯(lián)邦學習的沙盒機制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲介質(zhì)
- 一種應(yīng)用于異構(gòu)計算設(shè)備的聯(lián)邦學習系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





