[發(fā)明專利]平衡各方調(diào)查數(shù)據(jù)差異的縱向聯(lián)邦學(xué)習(xí)方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202211699464.7 | 申請(qǐng)日: | 2022-12-28 |
| 公開(公告)號(hào): | CN116341688A | 公開(公告)日: | 2023-06-27 |
| 發(fā)明(設(shè)計(jì))人: | 關(guān)志;陳鐘;唐禮勇;韓亞;吳振豪;高健博;陳子明;任立峰;劉勇;孔堅(jiān);黃亮;張鍇;劉娟 | 申請(qǐng)(專利權(quán))人: | 北京大學(xué);奇安信科技集團(tuán)股份有限公司;北京大學(xué)重慶大數(shù)據(jù)研究院 |
| 主分類號(hào): | G06N20/20 | 分類號(hào): | G06N20/20;G06F18/214 |
| 代理公司: | 北京君尚知識(shí)產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 余功勛 |
| 地址: | 100871 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 平衡 各方 調(diào)查 數(shù)據(jù) 差異 縱向 聯(lián)邦 學(xué)習(xí)方法 系統(tǒng) | ||
本公開涉及一種平衡各方調(diào)查數(shù)據(jù)差異的縱向聯(lián)邦學(xué)習(xí)方法及系統(tǒng),屬于聯(lián)邦學(xué)習(xí)技術(shù)領(lǐng)域。該方法包括:確定參與共同訓(xùn)練模型的模型結(jié)構(gòu),并初始化模型參數(shù);基于本地?cái)?shù)據(jù)對(duì)參與共同訓(xùn)練模型進(jìn)行訓(xùn)練,得到本地訓(xùn)練模型及相應(yīng)的模型參數(shù)集合;通過(guò)節(jié)點(diǎn)之間的數(shù)據(jù)交互,獲取其他節(jié)點(diǎn)經(jīng)過(guò)本地訓(xùn)練后改動(dòng)的模型參數(shù)集合;基于模型參數(shù)集合中每一位置上的參數(shù)類型,從所有本地訓(xùn)練模型選出需要聯(lián)邦學(xué)習(xí)模型,并將其他的本地訓(xùn)練模型作為對(duì)應(yīng)節(jié)點(diǎn)的最終模型。本發(fā)明可以解決縱向聯(lián)邦學(xué)習(xí)模型的可接受度不高問(wèn)題。
技術(shù)領(lǐng)域
本發(fā)明提供一種平衡各方調(diào)查數(shù)據(jù)差異的縱向聯(lián)邦學(xué)習(xí)方法及系統(tǒng),涉及聯(lián)邦學(xué)習(xí)技術(shù)領(lǐng)域。
背景技術(shù)
根據(jù)聯(lián)邦學(xué)習(xí)中不同client上的數(shù)據(jù)在特征空間(X)和樣本ID空間(I)中的分布特征將聯(lián)邦學(xué)習(xí)分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí)。
其中,縱向聯(lián)邦學(xué)習(xí)又被稱為基于特征的聯(lián)邦學(xué)習(xí)(特征在變),應(yīng)用場(chǎng)景為兩個(gè)或多個(gè)client上的數(shù)據(jù)集擁有相同的樣本ID空間,而特征空間不同,目的是通過(guò)擴(kuò)展特征的數(shù)量提高模型訓(xùn)練的精度。
在現(xiàn)有的縱向聯(lián)邦學(xué)習(xí)中,不同節(jié)點(diǎn)共享某對(duì)象的不同特征,豐富了特征數(shù)據(jù)的維度。但是,縱向聯(lián)邦學(xué)習(xí)中的學(xué)習(xí)目標(biāo)則只以某個(gè)節(jié)點(diǎn)的論斷為依據(jù),忽略了其他節(jié)點(diǎn)的不同看法,容易導(dǎo)致模型的可接受度不高。
發(fā)明內(nèi)容
為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供一種平衡各方調(diào)查數(shù)據(jù)差異的縱向聯(lián)邦學(xué)習(xí)方法及系統(tǒng),用以解決縱向聯(lián)邦學(xué)習(xí)模型的可接受度不高問(wèn)題。
本發(fā)明的技術(shù)內(nèi)容包括:
一種平衡各方調(diào)查數(shù)據(jù)差異的縱向聯(lián)邦學(xué)習(xí)方法,應(yīng)用于參與聯(lián)邦學(xué)習(xí)節(jié)點(diǎn),所述方法包括:
確定參與共同訓(xùn)練模型的模型結(jié)構(gòu),并初始化模型參數(shù);
基于本地?cái)?shù)據(jù)對(duì)參與共同訓(xùn)練模型進(jìn)行訓(xùn)練,得到本地訓(xùn)練模型及相應(yīng)的模型參數(shù)集合;
通過(guò)節(jié)點(diǎn)之間的數(shù)據(jù)交互,獲取其他節(jié)點(diǎn)經(jīng)過(guò)本地訓(xùn)練后改動(dòng)的模型參數(shù)集合;
基于模型參數(shù)集合中每一位置上的參數(shù)類型,從所有本地訓(xùn)練模型選出需要聯(lián)邦學(xué)習(xí)模型,并將其他的本地訓(xùn)練模型作為對(duì)應(yīng)節(jié)點(diǎn)的最終模型;
訓(xùn)練節(jié)點(diǎn)對(duì)所述需要聯(lián)邦訓(xùn)練模型進(jìn)行聯(lián)邦學(xué)習(xí),并在滿足設(shè)定條件時(shí),得到各訓(xùn)練節(jié)點(diǎn)的最終模型;其中,所述訓(xùn)練節(jié)點(diǎn)為需要聯(lián)邦學(xué)習(xí)模型對(duì)應(yīng)的節(jié)點(diǎn)。
進(jìn)一步地,所述確定參與共同訓(xùn)練模型的模型結(jié)構(gòu),并初始化模型參數(shù)之前,還包括:
根據(jù)數(shù)據(jù)對(duì)象的唯一編碼和數(shù)據(jù)特征的唯一編碼,對(duì)所述本地?cái)?shù)據(jù)進(jìn)行數(shù)據(jù)對(duì)齊。
進(jìn)一步地,所述基于模型參數(shù)集合中每一位置上的參數(shù)類型,從所有本地訓(xùn)練模型選出需要聯(lián)邦學(xué)習(xí)模型,并將其他的本地訓(xùn)練模型作為對(duì)應(yīng)節(jié)點(diǎn)的最終模型,包括:
對(duì)所有模型參數(shù)集合中的每一位置進(jìn)行參數(shù)類型交集;
在任一模型參數(shù)集合與其他模型參數(shù)集合的參數(shù)類型交集為空時(shí),將對(duì)應(yīng)的本地訓(xùn)練模型作為對(duì)應(yīng)節(jié)點(diǎn)的最終模型;
在一模型參數(shù)集合與其他模型參數(shù)集合的參數(shù)類型交集為不空時(shí),將對(duì)應(yīng)的本地訓(xùn)練模型作為需要聯(lián)邦學(xué)習(xí)模型。
進(jìn)一步地,所述訓(xùn)練節(jié)點(diǎn)對(duì)所述需要聯(lián)邦訓(xùn)練模型進(jìn)行聯(lián)邦學(xué)習(xí),并在滿足設(shè)定條件時(shí),得到各訓(xùn)練節(jié)點(diǎn)的最終模型,包括:
對(duì)所有需要聯(lián)邦訓(xùn)練模型Vi(t-1)中存在參數(shù)類型交集位置進(jìn)行參數(shù)值聚合,得到該位置更新后的參數(shù)值;其中,i表示訓(xùn)練節(jié)點(diǎn)的編號(hào),t表示訓(xùn)練輪數(shù),聯(lián)邦訓(xùn)練模型為所述本地訓(xùn)練模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué);奇安信科技集團(tuán)股份有限公司;北京大學(xué)重慶大數(shù)據(jù)研究院,未經(jīng)北京大學(xué);奇安信科技集團(tuán)股份有限公司;北京大學(xué)重慶大數(shù)據(jù)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211699464.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 解析系統(tǒng)和該系統(tǒng)中的解析方法、以及收集用于解析的調(diào)查結(jié)果的系統(tǒng)
- 一種自助式調(diào)查系統(tǒng)和調(diào)查方法
- 一種多渠道調(diào)查方法及系統(tǒng)
- 智能化信息調(diào)查裝置及方法
- 基于Linux環(huán)境的數(shù)字取證系統(tǒng)
- 案件調(diào)查方法、服務(wù)器和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種問(wèn)卷調(diào)查方法及裝置
- 調(diào)查任務(wù)處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于大數(shù)據(jù)的問(wèn)卷調(diào)查數(shù)據(jù)處理方法、裝置及存儲(chǔ)介質(zhì)
- 基于無(wú)人車的問(wèn)卷調(diào)查方法、裝置及問(wèn)卷調(diào)查無(wú)人車
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





