[發(fā)明專(zhuān)利]一種聯(lián)邦學(xué)習(xí)場(chǎng)景中的數(shù)據(jù)選擇方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011464915.X | 申請(qǐng)日: | 2020-12-14 |
| 公開(kāi)(公告)號(hào): | CN112464269A | 公開(kāi)(公告)日: | 2021-03-09 |
| 發(fā)明(設(shè)計(jì))人: | 張?zhí)m;李向陽(yáng);李安然 | 申請(qǐng)(專(zhuān)利權(quán))人: | 德清阿爾法創(chuàng)新研究院 |
| 主分類(lèi)號(hào): | G06F21/60 | 分類(lèi)號(hào): | G06F21/60;G06F21/62;G06N20/00 |
| 代理公司: | 杭州九洲專(zhuān)利事務(wù)所有限公司 33101 | 代理人: | 陳琦;陳繼亮 |
| 地址: | 313200 浙江*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 聯(lián)邦 學(xué)習(xí) 場(chǎng)景 中的 數(shù)據(jù) 選擇 方法 | ||
1.一種聯(lián)邦學(xué)習(xí)場(chǎng)景中的數(shù)據(jù)選擇方法,其特征在于所述該方法包括過(guò)濾出和任務(wù)相關(guān)的用戶和數(shù)據(jù)、訓(xùn)練前用戶選擇、訓(xùn)練過(guò)程中用戶和數(shù)據(jù)選擇、模型訓(xùn)練。
2.根據(jù)權(quán)利要求1所述的聯(lián)邦學(xué)習(xí)場(chǎng)景中的數(shù)據(jù)選擇方法,其特征在于所述任務(wù)相關(guān)用戶和數(shù)據(jù)過(guò)濾為當(dāng)一FL任務(wù)到達(dá)時(shí),server首先通過(guò)計(jì)算每個(gè)用戶Ck,k∈[K]的標(biāo)簽集Yk={yk|(xk,yk)∈Dk}和目標(biāo)標(biāo)簽集Y的交集{(xk,yk)|yk∈Yk∩Y},以過(guò)濾出擁有目標(biāo)類(lèi)別數(shù)據(jù)的用戶。如果相交集中的樣本數(shù)量超過(guò)目標(biāo)模型的最小數(shù)量|{(xk,yk)|yk∈Yk∩Yv,則該用戶是相關(guān)的,為了滿足隱私保護(hù)的需求,我們使用隱私保護(hù)求交技術(shù)(PSI)。
3.根據(jù)權(quán)利要求1所述的聯(lián)邦學(xué)習(xí)場(chǎng)景中的數(shù)據(jù)選擇方法,其特征在于所述訓(xùn)練前用戶選擇:server使用基于點(diǎn)陣行列式(DPP)算法從相關(guān)用戶集中進(jìn)一步選擇高質(zhì)量用戶集(用戶下標(biāo)集合Q),以在預(yù)算約束B(niǎo)下最大化同質(zhì)性和內(nèi)容多樣性:maxV(Q),s.t.,∑k∈Q,Q∈N′bk≤B.V(Q)是被選中的用戶的質(zhì)量?jī)r(jià)值。然后,server協(xié)調(diào)選定的用戶以開(kāi)始訓(xùn)練模型。在該模塊中,主要分為以下步驟:
a)基于同質(zhì)性用戶選擇:server優(yōu)先選擇那些數(shù)據(jù)分布均勻且類(lèi)別不缺失的用戶。以同質(zhì)性為選擇用戶的指標(biāo)時(shí),Vμ(Q)=∑k∈Qμk,μk定義為用戶k的數(shù)據(jù)分布和均勻分布之間的差異性,即:
為了保護(hù)隱私的計(jì)算μk,我們利用基于BGN的同態(tài)加密的高效安全的兩方計(jì)算協(xié)議,讓server和每個(gè)用戶使用server的公鑰共同計(jì)算。然后server通過(guò)貪婪地選擇具有最大的用戶,直到預(yù)算B用完,找到最佳用戶集合。
b)基于多樣性用戶選擇:server選擇那些數(shù)據(jù)內(nèi)容多樣的用戶參與模型訓(xùn)練。以內(nèi)容多樣性為選擇用戶的指標(biāo)時(shí),V(Q)=ρ(D),D∪k∈QDk,其中S(vi,vj)是計(jì)算用戶Ci,Cj間的相似性函數(shù),比如歐式距離。Server貪婪地選擇與當(dāng)前用戶集相似性最低的下一個(gè)用戶。
為了計(jì)算數(shù)據(jù)集的內(nèi)容多樣性,首先需要提取數(shù)據(jù)的特征向量表達(dá),我們使用深度學(xué)習(xí)模型提取特征,比如使用VGG-16網(wǎng)絡(luò)提取圖片的內(nèi)容特征向量,然后去計(jì)算該用戶所有數(shù)據(jù)的內(nèi)容多樣性。當(dāng)該用戶的數(shù)據(jù)量M較大,且特征向量維度l較高時(shí),計(jì)算內(nèi)容多樣性開(kāi)銷(xiāo)很大O(M2l),同時(shí)現(xiàn)有的計(jì)算方法需要直接接觸到原始數(shù)據(jù),因此我們提出了一種高效的隱私保護(hù)的內(nèi)容多樣性計(jì)算方法,該方法通過(guò)基于JL變換的低維向量來(lái)構(gòu)建每個(gè)用戶數(shù)據(jù)集的特征,并使用隨機(jī)響應(yīng)機(jī)制保護(hù)每個(gè)樣本的隱私,主要分為以下步驟:
i.構(gòu)建數(shù)據(jù)集內(nèi)容草圖:用戶Ck本地生成內(nèi)容特征向量φk={φk,i|i∈[Uk]},然后server選擇一個(gè)映射矩陣w將φk映射為一低維向量h(φk,i)=sign(w·φk,i)。這種映射造成的失真降低了多樣性的準(zhǔn)確性,但一定程度上保護(hù)了用戶映射向量的隱私,數(shù)據(jù)集DK的內(nèi)容向量草圖是
ii.隨機(jī)響應(yīng)機(jī)制:為了進(jìn)一步保護(hù)每個(gè)數(shù)據(jù)存在性的隱私,我們使用了隨機(jī)響應(yīng)機(jī)制來(lái)產(chǎn)生向量草圖h(φk,i)的擾動(dòng)向量表示以的概率為1,以的概率為0,并以1-f的概率為f是用戶自定義的控制隱私程度的參數(shù)。然后用戶使用擾動(dòng)向量生成擾動(dòng)草圖并把發(fā)送給server,server使用擾動(dòng)草圖向量計(jì)算相似性并計(jì)算內(nèi)容多樣性至此,server計(jì)算內(nèi)容多樣性的開(kāi)銷(xiāo)降低了若干數(shù)量級(jí),并且保護(hù)了用戶的數(shù)據(jù)隱私。
C)基于點(diǎn)陣行列式用戶選擇:當(dāng)同時(shí)考慮同質(zhì)性和多樣性時(shí),用戶選擇問(wèn)題被轉(zhuǎn)化成DPP問(wèn)題。用戶Ci的同質(zhì)性分?jǐn)?shù)是μi,和用戶Cj的相似性是Sij,我們定義一半正定矩陣A[N′]=[Aij]i,j∈[N′],Aij=uiujSij,那么用戶被選中的概率當(dāng)同質(zhì)性增加而相似性降低時(shí),行列式增加,因此,基于DPP的選擇傾向于選擇具有均勻分布類(lèi)別的用戶,同時(shí)避免內(nèi)容高度相似的用戶。價(jià)值函數(shù)SQ=[Sij]i,j∈Q.我們將用戶選擇問(wèn)題轉(zhuǎn)化成log-子模問(wèn)題,迭代地選中最大化PA(Q∪{k})的用戶Ck。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于德清阿爾法創(chuàng)新研究院,未經(jīng)德清阿爾法創(chuàng)新研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011464915.X/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過(guò)保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過(guò)保護(hù)特定的外圍設(shè)備,如鍵盤(pán)或顯示器
G06F21-06 .通過(guò)感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過(guò)限制訪問(wèn)計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過(guò)限制訪問(wèn)或處理程序或過(guò)程
- 一種Agent聯(lián)邦快速設(shè)計(jì)流程建模方法
- 基于聯(lián)邦模式的動(dòng)態(tài)產(chǎn)品協(xié)同開(kāi)發(fā)平臺(tái)及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動(dòng)態(tài)部署分配方法
- 聯(lián)邦學(xué)習(xí)方法、系統(tǒng)、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種混合聯(lián)邦學(xué)習(xí)方法及架構(gòu)
- 聯(lián)邦學(xué)習(xí)的沙盒機(jī)制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種應(yīng)用于異構(gòu)計(jì)算設(shè)備的聯(lián)邦學(xué)習(xí)系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 電視場(chǎng)景切換的方法及電視
- 視頻場(chǎng)景控制系統(tǒng)及方法
- 場(chǎng)景開(kāi)關(guān)及其場(chǎng)景開(kāi)關(guān)構(gòu)件和場(chǎng)景圖標(biāo)卡組件
- 場(chǎng)景聯(lián)動(dòng)方法及場(chǎng)景聯(lián)動(dòng)系統(tǒng)
- 一種視頻場(chǎng)景分類(lèi)方法、裝置、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種Unity3D引擎的場(chǎng)景切換方法和系統(tǒng)
- 一種自動(dòng)駕駛場(chǎng)景分類(lèi)識(shí)別系統(tǒng)及方法
- 一種虛擬場(chǎng)景生成方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種汽車(chē)圖像場(chǎng)景庫(kù)數(shù)據(jù)復(fù)雜度度量方法
- 場(chǎng)景識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





