[發(fā)明專利]一種基于博弈論的聯(lián)邦學(xué)習(xí)隱私策略選擇方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110292473.3 | 申請(qǐng)日: | 2021-03-18 |
| 公開(公告)號(hào): | CN112926088A | 公開(公告)日: | 2021-06-08 |
| 發(fā)明(設(shè)計(jì))人: | 林思昕;孫哲;殷麗華;那崇寧;李丹;李超;羅熙;韋南 | 申請(qǐng)(專利權(quán))人: | 之江實(shí)驗(yàn)室;廣州大學(xué) |
| 主分類號(hào): | G06F21/62 | 分類號(hào): | G06F21/62;G06N20/00;G06N5/04 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 賈玉霞 |
| 地址: | 310023 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 博弈論 聯(lián)邦 學(xué)習(xí) 隱私 策略 選擇 方法 | ||
1.一種基于博弈論的聯(lián)邦學(xué)習(xí)隱私策略選擇方法,其特征在于,該方法包括:服務(wù)器為參與方提供具有不同服務(wù)成本的模型質(zhì)量的權(quán)衡參數(shù)λMQ與隱私強(qiáng)度的權(quán)衡參數(shù)λPI的比值λMQ/λPI,參與方根據(jù)是否滿足服務(wù)質(zhì)量、隱私泄露代價(jià)來選擇最佳閾值,并用自身數(shù)據(jù)集訓(xùn)練模型,并把選擇的閾值和訓(xùn)練更新的模型參數(shù)發(fā)給服務(wù)器;服務(wù)器收集各個(gè)參與方的模型參數(shù)進(jìn)一步訓(xùn)練模型,獲得優(yōu)化的模型參數(shù),并更新服務(wù)閾值λMQ/λPI和服務(wù)成本后再發(fā)給參與方,以此服務(wù)器保持模型長期穩(wěn)定的服務(wù)狀態(tài)提供給參與方。
2.如權(quán)利要求1所述的基于博弈論的聯(lián)邦學(xué)習(xí)隱私策略選擇方法,其特征在于,在每次迭代中,服務(wù)器計(jì)算各個(gè)參與方的效用utilityi,以及所有參與方的效用平均值
3.如權(quán)利要求1所述的基于博弈論的聯(lián)邦學(xué)習(xí)隱私策略選擇方法,其特征在于,當(dāng)參與方采用低質(zhì)量的數(shù)據(jù)訓(xùn)練模型時(shí),得不到獎(jiǎng)勵(lì),即獎(jiǎng)勵(lì)為0,當(dāng)參與方采用低質(zhì)量的數(shù)據(jù)訓(xùn)練模型時(shí),會(huì)得到獎(jiǎng)勵(lì),獎(jiǎng)勵(lì)如下:
其中,x為演化博弈的迭代次數(shù),b為服務(wù)器獎(jiǎng)勵(lì)給參與方的收益,qos(ρ,r)=1-(1-ρ)r為模型全局服務(wù)質(zhì)量貢獻(xiàn)度函數(shù),ρ為全局服務(wù)質(zhì)量貢獻(xiàn)度,rx為在第x次迭代中選擇高質(zhì)量閾值的參與方數(shù)量,rfix為每一輪新訓(xùn)練中過時(shí)數(shù)據(jù)的價(jià)值,qosexpect為全局服務(wù)質(zhì)量的期望值,p為隱私泄露發(fā)生時(shí)的價(jià)值損失,pdr(σ,r)為參與方隱私的貢獻(xiàn)函數(shù),σ為參與方隱私貢獻(xiàn)度,Z為參與方選擇高質(zhì)量閾值的概率,N為參與方總數(shù)。
4.如權(quán)利要求3所述的基于博弈論的聯(lián)邦學(xué)習(xí)隱私策略選擇方法,其特征在于,服務(wù)器通過調(diào)節(jié)獎(jiǎng)勵(lì)的預(yù)算b,使得整個(gè)演化博弈模型最終穩(wěn)定在一個(gè)概率Z;該概率Z是指在訓(xùn)練更新模型的過程中,尋找到參與方選擇高質(zhì)量閾值的概率,來保證模型的長期服務(wù)質(zhì)量;通過多輪迭代,最終整個(gè)服務(wù)訓(xùn)練的參與者有Z的概率選擇高質(zhì)量數(shù)據(jù)訓(xùn)練模型,1-Z的概率選擇低質(zhì)量數(shù)據(jù)訓(xùn)練模型,Z的計(jì)算方法如下:Z=
5.如權(quán)利要求3所述的基于博弈論的聯(lián)邦學(xué)習(xí)隱私策略選擇方法,其特征在于:所述參與方的效用utilityi根據(jù)數(shù)據(jù)質(zhì)量進(jìn)行區(qū)分,具體計(jì)算公式如下:
其中,j表示高質(zhì)量數(shù)據(jù)的等級(jí),reward(x)表示每輪迭代每位參與方的獎(jiǎng)勵(lì),cost(x)是每輪迭代每位參與方支出的服務(wù)費(fèi)用。
6.根據(jù)權(quán)利要求1所述的基于博弈論的聯(lián)邦學(xué)習(xí)隱私策略選擇方法,其特征在于,該方法包括如下步驟:
步驟S1:服務(wù)器通過用不同的閾值λMQ/λPI訓(xùn)練模型,并為每個(gè)閾值λMQ/λPI設(shè)置不同的服務(wù)費(fèi);其中,λMQ為模型質(zhì)量的權(quán)衡參數(shù),λPI為隱私強(qiáng)度的權(quán)衡參數(shù);
步驟S2:服務(wù)器將訓(xùn)練后的模型、不同閾值及其對(duì)應(yīng)的服務(wù)費(fèi)等發(fā)給各個(gè)參與方選擇;
步驟S3:各參與方根據(jù)自身對(duì)服務(wù)質(zhì)量、隱私保護(hù)強(qiáng)度的要求等選擇合適的閾值λMQ/λPI,并支付給服務(wù)器對(duì)應(yīng)的服務(wù)費(fèi);
步驟S4:各參與方在選擇完畢后,使用本地的數(shù)據(jù)集訓(xùn)練模型,并把閾值及其對(duì)應(yīng)的費(fèi)用和更新后的參數(shù)發(fā)送給服務(wù)器;
步驟S5:服務(wù)器對(duì)各參與方的模型參數(shù)進(jìn)行匯總調(diào)整,再次訓(xùn)練模型,并且根據(jù)閾值的選擇情況重新設(shè)置服務(wù)費(fèi);
步驟S6:服務(wù)器將每位參與方選擇的閾值λMQ/λPI與服務(wù)器設(shè)定的閾值范圍進(jìn)行比較,當(dāng)參與方選擇的閾值λMQ/λPI不在服務(wù)器設(shè)定的閾值范圍內(nèi)時(shí),則認(rèn)為該參與方選擇的是低服務(wù)質(zhì)量,則得不到獎(jiǎng)勵(lì),效益為0;當(dāng)參與方選擇的閾值λMQ/λPI在服務(wù)器設(shè)定的閾值范圍內(nèi)時(shí),則認(rèn)為該參與方選擇的是高服務(wù)質(zhì)量;
步驟S7:服務(wù)器根據(jù)各個(gè)參與方的效用utilityi,計(jì)算本次迭代的總體參與方的效用平均值
計(jì)算該參與方的效用utilityi如下:
步驟S8:重復(fù)步驟S2~步驟S7,當(dāng)參與方的效用大于等于總體的平均效用值時(shí),參與方保持當(dāng)前迭代的閾值選擇不變;反之,參與方則需要重新選擇閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于之江實(shí)驗(yàn)室;廣州大學(xué),未經(jīng)之江實(shí)驗(yàn)室;廣州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110292473.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程
- 一種基于博弈論的MIMO信道跟蹤方法
- 一種基于終端制式差異的異構(gòu)網(wǎng)負(fù)載分配方法
- 基于博弈論的微網(wǎng)負(fù)荷控制方法
- 一種基于博弈論的南水北調(diào)水資源調(diào)度方法
- 一種基于博弈論的車聯(lián)網(wǎng)RSU最優(yōu)配置方法
- 一種融合目標(biāo)外觀模型和博弈論的視頻目標(biāo)互遮擋處理方法
- 一種基于滿意博弈論的飛行器沖突解脫方法及裝置
- 一種基于博弈論的網(wǎng)絡(luò)攻擊風(fēng)險(xiǎn)控制方法及系統(tǒng)
- 基于貝葉斯博弈和聲譽(yù)評(píng)分的網(wǎng)絡(luò)惡意用戶防御方法
- 基于博弈論的區(qū)塊鏈通證激勵(lì)裝置、方法、介質(zhì)及終端
- 一種Agent聯(lián)邦快速設(shè)計(jì)流程建模方法
- 基于聯(lián)邦模式的動(dòng)態(tài)產(chǎn)品協(xié)同開發(fā)平臺(tái)及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動(dòng)態(tài)部署分配方法
- 聯(lián)邦學(xué)習(xí)方法、系統(tǒng)、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種混合聯(lián)邦學(xué)習(xí)方法及架構(gòu)
- 聯(lián)邦學(xué)習(xí)的沙盒機(jī)制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種應(yīng)用于異構(gòu)計(jì)算設(shè)備的聯(lián)邦學(xué)習(xí)系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測方法及系統(tǒng)





