[發(fā)明專利]基于強(qiáng)化學(xué)習(xí)的隱私策略優(yōu)化方法、系統(tǒng)及可讀存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202011015760.1 | 申請(qǐng)日: | 2020-09-24 |
| 公開(公告)號(hào): | CN112214791B | 公開(公告)日: | 2023-04-18 |
| 發(fā)明(設(shè)計(jì))人: | 孫哲;殷麗華;萬俊平;李超;羅熙;顧釗銓;張偉哲 | 申請(qǐng)(專利權(quán))人: | 廣州大學(xué);鵬城實(shí)驗(yàn)室 |
| 主分類號(hào): | G06F21/62 | 分類號(hào): | G06F21/62;G06N3/0442;G06N3/092 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 郭浩輝;麥小嬋 |
| 地址: | 510006 廣東省廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 強(qiáng)化 學(xué)習(xí) 隱私 策略 優(yōu)化 方法 系統(tǒng) 可讀 存儲(chǔ) 介質(zhì) | ||
1.一種基于強(qiáng)化學(xué)習(xí)的隱私策略優(yōu)化方法,其特征在于,所述方法包括如下步驟:
在移動(dòng)端部署n層神經(jīng)元網(wǎng)絡(luò)作為輸入樣本特征提取器,并在云端部署已獨(dú)立完成訓(xùn)練的輸入樣本重構(gòu)器、目標(biāo)分類器及隱私分類器,以完成初始模型的初始化;
通過測(cè)試樣本集對(duì)所述初始模型進(jìn)行測(cè)試,將測(cè)試信息、當(dāng)前的超參數(shù)和層數(shù)存儲(chǔ)于一信息單元,設(shè)置并初始化超參數(shù)優(yōu)化器;其中,所述測(cè)試信息包括當(dāng)前樣本平均復(fù)原度、隱私推測(cè)準(zhǔn)確率、目標(biāo)分類準(zhǔn)確率、輸入樣本特征提取器的輸出層參數(shù)、運(yùn)行時(shí)長(zhǎng)和能耗信息;
將所述信息單元的狀態(tài)信息輸入超參數(shù)優(yōu)化器中進(jìn)行超參數(shù)信息優(yōu)化方案的選擇、執(zhí)行與優(yōu)化方案獎(jiǎng)勵(lì)值的計(jì)算,并根據(jù)計(jì)算結(jié)果進(jìn)行超參數(shù)優(yōu)化器樣本的增加、優(yōu)化方案價(jià)值的更新及超參數(shù)優(yōu)化器網(wǎng)絡(luò)參數(shù)的更新;
當(dāng)隱私信息與業(yè)務(wù)可用性之間的相關(guān)性的權(quán)衡效果平衡時(shí),運(yùn)行所述初始模型,通過當(dāng)前超參數(shù)優(yōu)化器網(wǎng)絡(luò)對(duì)所述初始模型進(jìn)行優(yōu)化,并獲取最終的超參數(shù)優(yōu)化結(jié)果和層數(shù)n;
所述初始模型的創(chuàng)建方法包括:
分別將L(TC)-λARL(AR)及L(TC)-λPCL(PC)作為圖像復(fù)原訓(xùn)練及隱私推測(cè)訓(xùn)練的輸入樣本特征提取器的損失函數(shù);其中,L(TC)為業(yè)務(wù)任務(wù)網(wǎng)絡(luò)的損失函數(shù),L(PC)為隱私推測(cè)網(wǎng)絡(luò)的損失函數(shù),λPC為調(diào)節(jié)業(yè)務(wù)任務(wù)識(shí)別準(zhǔn)確率和隱私推測(cè)保護(hù)強(qiáng)度之間的閾值,0λPC1,且λPC越小,特征用于業(yè)務(wù)任務(wù)識(shí)別的準(zhǔn)確率越高,λPC越大,特征用于隱私推測(cè)保護(hù)的效果越好,L(AR)為樣本復(fù)原網(wǎng)絡(luò)的損失函數(shù),λAR為調(diào)節(jié)業(yè)務(wù)任務(wù)識(shí)別準(zhǔn)確率和樣本復(fù)原保護(hù)強(qiáng)度之間的閾值,0λAR1,且λAR越小,特征用于業(yè)務(wù)任務(wù)識(shí)別的準(zhǔn)確率越高,λAR越大,特征用于樣本復(fù)原保護(hù)的效果越好;
以輸入樣本特征提取器輸出的樣本特征作為輸入,再次對(duì)所述輸入樣本特征提取器、輸入樣本重構(gòu)器、目標(biāo)分類器及隱私分類器進(jìn)行訓(xùn)練,直至得到收斂的輸入樣本特征提取器的參數(shù);
所述根據(jù)計(jì)算結(jié)果進(jìn)行超參數(shù)優(yōu)化器樣本的增加、優(yōu)化方案價(jià)值的更新及超參數(shù)優(yōu)化器網(wǎng)絡(luò)參數(shù)的更新的方法包括:
將所述信息單元中輸入樣本特征提取器的輸出層參數(shù)、超參數(shù)及層數(shù)與第T-1次測(cè)試所得到的狀態(tài)信息元組進(jìn)行合并,組成當(dāng)前狀態(tài)信息元組;其中,T-1次測(cè)試指的是前一次測(cè)試;
將所述狀態(tài)信息元組輸入超參數(shù)優(yōu)化器網(wǎng)絡(luò),通過貪婪算法進(jìn)行超參數(shù)優(yōu)化方案的選擇與初始模型的訓(xùn)練,并對(duì)信息單元與當(dāng)前狀態(tài)信息元組更新;
對(duì)更新后的信息單元中的測(cè)試信息做歸一化處理,得到所述超參數(shù)優(yōu)化方案的獎(jiǎng)勵(lì)值;
將獲得的五元組存儲(chǔ)至超參數(shù)優(yōu)化器的經(jīng)驗(yàn)池中,并從經(jīng)驗(yàn)池中取出若干個(gè)五元組,并將元組中的新狀態(tài)信息輸入超參數(shù)優(yōu)化器網(wǎng)絡(luò)中進(jìn)行優(yōu)化方案價(jià)值的更新;其中,所述五元組包括狀態(tài)信息元組St、超參數(shù)修改方案at、當(dāng)前狀態(tài)信元組St+1、獎(jiǎng)勵(lì)值reward、優(yōu)化結(jié)束標(biāo)志done;
根據(jù)更新后的優(yōu)化方案價(jià)值,通過均方差損失函數(shù)更新所述超參數(shù)優(yōu)化器網(wǎng)絡(luò)參數(shù)。
2.根據(jù)權(quán)利要求1所述的基于強(qiáng)化學(xué)習(xí)的隱私策略優(yōu)化方法,其特征在于,在對(duì)初始模型進(jìn)行初始化的步驟之前,所述方法還包括:
當(dāng)隱私信息與業(yè)務(wù)可用性之間的相關(guān)性為第一相關(guān)性時(shí),根據(jù)用戶的選擇調(diào)整業(yè)務(wù)任務(wù)識(shí)別準(zhǔn)確率或隱私推測(cè)準(zhǔn)確率;其中,第一相關(guān)性為信息與業(yè)務(wù)可用性的特征極其相關(guān);
當(dāng)隱私信息與業(yè)務(wù)可用性之間的相關(guān)性為第二相關(guān)性時(shí),調(diào)整輸入樣本特征提取器中的損失函數(shù)系數(shù),以得到不同隱私保護(hù)強(qiáng)度下的業(yè)務(wù)識(shí)別準(zhǔn)確率;其中,第二相關(guān)性為隱私信息與業(yè)務(wù)可用性的特征比較相關(guān);
當(dāng)隱私信息與業(yè)務(wù)可用性之間的相關(guān)性為第三相關(guān)性時(shí),根據(jù)用戶的選擇調(diào)整業(yè)務(wù)任務(wù)識(shí)別準(zhǔn)確率與隱私推測(cè)準(zhǔn)確率;其中,第三相關(guān)性為隱私信息與業(yè)務(wù)可用性的特征幾乎不相關(guān)。
3.根據(jù)權(quán)利要求1所述的基于強(qiáng)化學(xué)習(xí)的隱私策略優(yōu)化方法,其特征在于,設(shè)置并初始化超參數(shù)優(yōu)化器的方法包括:設(shè)置一個(gè)隨機(jī)參數(shù)的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)作為超參數(shù)優(yōu)化器并初始化其超參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州大學(xué);鵬城實(shí)驗(yàn)室,未經(jīng)廣州大學(xué);鵬城實(shí)驗(yàn)室許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011015760.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 一種授權(quán)管理系統(tǒng)和方法及授權(quán)管理服務(wù)器
- 一種授權(quán)管理系統(tǒng)和方法及授權(quán)管理服務(wù)器
- 用于生成隱私簡(jiǎn)檔的方法和設(shè)備
- 手機(jī)隱私保護(hù)系統(tǒng)
- 密碼設(shè)置方法及裝置
- 移動(dòng)終端和移動(dòng)終端的隱私保護(hù)方法
- 一種隱私信息保護(hù)方法、裝置及系統(tǒng)
- 一種隱私信息管理方法、裝置和系統(tǒng)
- 圖片隱私的預(yù)測(cè)方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種基于區(qū)塊鏈的隱私安全管理系統(tǒng)





