[發(fā)明專利]一種基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法及聯(lián)邦學(xué)習(xí)系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202210642937.3 | 申請(qǐng)日: | 2022-06-08 |
| 公開(公告)號(hào): | CN115018086A | 公開(公告)日: | 2022-09-06 |
| 發(fā)明(設(shè)計(jì))人: | 唐斌;徐佳俐;葉保留 | 申請(qǐng)(專利權(quán))人: | 河海大學(xué) |
| 主分類號(hào): | G06N20/00 | 分類號(hào): | G06N20/00;H04L67/1097 |
| 代理公司: | 南京泉為知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32408 | 代理人: | 許丹丹 |
| 地址: | 211100 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 聯(lián)邦 學(xué)習(xí) 模型 訓(xùn)練 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法及聯(lián)邦學(xué)習(xí)系統(tǒng),所述方法包括:客戶向中央服務(wù)器提交一組投標(biāo),包括客戶可參與訓(xùn)練的最大數(shù)據(jù)量和單位數(shù)據(jù)成本;中央服務(wù)器設(shè)立參數(shù)提交的截止時(shí)間T,收到投標(biāo)后根據(jù)動(dòng)態(tài)規(guī)劃,以期望社會(huì)福利最大化為目的,在偽多項(xiàng)式時(shí)間內(nèi)得出選擇什么客戶和選擇客戶的多少數(shù)據(jù)量,將客戶選擇方案下發(fā);客戶訓(xùn)練完成后向中央服務(wù)器上報(bào)更新參數(shù);中央服務(wù)器收到客戶更新的參數(shù)后基于VCG機(jī)制對(duì)其進(jìn)行獎(jiǎng)勵(lì)。本發(fā)明考慮了客戶訓(xùn)練時(shí)間的不確定性和中央服務(wù)器選擇數(shù)據(jù)的機(jī)動(dòng)性,激勵(lì)方法并不會(huì)影響到模型的訓(xùn)練效率,還會(huì)達(dá)到公平的激勵(lì)效果,最終提升模型的精確度。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)計(jì)算領(lǐng)域,具體涉及一種基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法及聯(lián)邦學(xué)習(xí)系統(tǒng)。
背景技術(shù)
聯(lián)邦學(xué)習(xí)(Federal Learning,F(xiàn)L)可在數(shù)據(jù)不共享的狀況下完成聯(lián)合建模。在聯(lián)邦學(xué)習(xí)中,機(jī)器學(xué)習(xí)任務(wù)是由參與設(shè)備(也稱之為客戶端,或簡(jiǎn)稱為客戶)的松散聯(lián)合體解決的,中央服務(wù)器對(duì)這些設(shè)備進(jìn)行協(xié)調(diào)。其最重要的特性就是去除了傳統(tǒng)的集中式機(jī)器學(xué)習(xí)的收集和存儲(chǔ)數(shù)據(jù)的過程,降低機(jī)器學(xué)習(xí)帶來的許多系統(tǒng)性隱私風(fēng)險(xiǎn)。聯(lián)邦學(xué)習(xí)可以實(shí)現(xiàn)保證本地訓(xùn)練數(shù)據(jù)不公開的前提下,多個(gè)數(shù)據(jù)擁有者協(xié)同訓(xùn)練一個(gè)共享的機(jī)器學(xué)習(xí)的模型。它們只需迭代地將訓(xùn)練的本地模型更新發(fā)送到任務(wù)發(fā)布者,而無需將原始數(shù)據(jù)上傳到外部,從而將機(jī)器學(xué)習(xí)的過程與在中央服務(wù)器中獲取、存儲(chǔ)和訓(xùn)練數(shù)據(jù)分離。
盡管聯(lián)邦學(xué)習(xí)可以支持協(xié)作學(xué)習(xí)的同時(shí)保護(hù)數(shù)據(jù)隱私,但是所有客戶不會(huì)無條件地貢獻(xiàn)其資源,一方面擁有的數(shù)據(jù)本身具有價(jià)值性;另一方面,參與訓(xùn)練需要消耗自己設(shè)備的電量。因此,構(gòu)建一種合適的獎(jiǎng)勵(lì)機(jī)制能夠鼓勵(lì)客戶參與到學(xué)習(xí)中來具有重要意義。
為了使聯(lián)邦學(xué)習(xí)可以長(zhǎng)期有效地進(jìn)行,很多應(yīng)用也采用了不同的方法進(jìn)行激勵(lì)。針對(duì)客戶自身方案,可以自行選擇服務(wù)器提供的合同,或者主動(dòng)報(bào)告自己的出價(jià)。中央服務(wù)器根據(jù)客戶的方案,依據(jù)自己的目標(biāo)制定客戶的選擇和獎(jiǎng)勵(lì)方案,從而在一定程度上解決聯(lián)邦學(xué)習(xí)中的激勵(lì)問題。
一般針對(duì)聯(lián)邦學(xué)習(xí)中的激勵(lì)方法主要集中在考慮所需的資源量、本地精度、信道沖突和相應(yīng)的能源成本等等因素,且一般都在服務(wù)器會(huì)正常接收到所有目標(biāo)客戶更新參數(shù)的情況下。然而,根據(jù)當(dāng)前署名發(fā)明人的工作發(fā)現(xiàn),在聯(lián)邦學(xué)習(xí)的現(xiàn)實(shí)情況中,因?yàn)楦饕苿?dòng)用戶網(wǎng)絡(luò)狀況、訓(xùn)練能力的不同,客戶訓(xùn)練的時(shí)間常常是不確定的且存在較大差異。中央服務(wù)器基于任務(wù)的時(shí)效性,不會(huì)無限期地等待所有的客戶上傳本輪參數(shù)后再進(jìn)行模型聚合,客戶也可能因?yàn)橥ㄐ拧⒆陨砉收系仍虿荒芗皶r(shí)上傳訓(xùn)練好的參數(shù)。如果激勵(lì)方法中不對(duì)訓(xùn)練和截止時(shí)間提出要求,中央服務(wù)器的工作效率不但會(huì)下降,還會(huì)給并沒有為本輪全局模型更新做出貢獻(xiàn)的客戶獎(jiǎng)勵(lì),導(dǎo)致激勵(lì)不均。
發(fā)明內(nèi)容
發(fā)明目的:本發(fā)明的目的是提出一種基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法及聯(lián)邦學(xué)習(xí)系統(tǒng),考慮客戶訓(xùn)練時(shí)間的不確定性來建立激勵(lì)機(jī)制,使得激勵(lì)方法并不會(huì)影響到模型的訓(xùn)練效率,還會(huì)達(dá)到公平的激勵(lì)效果,最終提升模型的精確度。
技術(shù)方案:為了實(shí)現(xiàn)以上發(fā)明目的,本發(fā)明的技術(shù)方案如下:
一種基于聯(lián)邦學(xué)習(xí)的模型訓(xùn)練方法,包括以下步驟:
S1、客戶i基于中央服務(wù)器發(fā)布的聯(lián)邦學(xué)習(xí)的訓(xùn)練任務(wù),收集自己可供本次聯(lián)邦學(xué)習(xí)訓(xùn)練的本地?cái)?shù)據(jù)量bi和單位數(shù)據(jù)成本ci,組成投標(biāo)bi={di,ci}并提交給中央服務(wù)器;
S2、中央服務(wù)器設(shè)立參數(shù)提交的截止時(shí)間T,根據(jù)收到的投標(biāo)建立期望社會(huì)福利最大化表達(dá)式;
S3、中央服務(wù)器針對(duì)每輪訓(xùn)練設(shè)置預(yù)算B,根據(jù)動(dòng)態(tài)規(guī)劃求出每個(gè)預(yù)算B下的最優(yōu)解,包括選中的客戶和被選中客戶的最優(yōu)訓(xùn)練數(shù)據(jù)量,再根據(jù)每個(gè)預(yù)算B下的最優(yōu)解計(jì)算期望社會(huì)福利最大化的最優(yōu)值;
S4、中央服務(wù)器向選中的客戶下發(fā)最優(yōu)訓(xùn)練數(shù)據(jù)量和最大社會(huì)福利;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于河海大學(xué),未經(jīng)河海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210642937.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種Agent聯(lián)邦快速設(shè)計(jì)流程建模方法
- 基于聯(lián)邦模式的動(dòng)態(tài)產(chǎn)品協(xié)同開發(fā)平臺(tái)及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動(dòng)態(tài)部署分配方法
- 聯(lián)邦學(xué)習(xí)方法、系統(tǒng)、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種混合聯(lián)邦學(xué)習(xí)方法及架構(gòu)
- 聯(lián)邦學(xué)習(xí)的沙盒機(jī)制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種應(yīng)用于異構(gòu)計(jì)算設(shè)備的聯(lián)邦學(xué)習(xí)系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





