[發明專利]一種基于強化學習的隱私保護移動群智感知方法有效
| 申請號: | 202110727758.5 | 申請日: | 2021-06-29 |
| 公開(公告)號: | CN113553614B | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 林暉;胡嘉;汪曉丁;妙秦陽 | 申請(專利權)人: | 福建師范大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F21/64;G06F16/27 |
| 代理公司: | 福州市博深專利事務所(普通合伙) 35214 | 代理人: | 林振杰 |
| 地址: | 350000 福建省*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 強化 學習 隱私 保護 移動 感知 方法 | ||
1.一種基于強化學習的隱私保護移動群智感知方法,其特征在于,包括:
S1、基于激勵機制進行KL隱私保護的數據聚合;
步驟S1中,所述數據聚合的聚合數據?是通過第
;
步驟S1包括:
S11、每個所述參與用戶端
;
其中;
因此將上述公式一改寫為:
;
S12、計算聚合精度半徑,所述聚合精度半徑表示從真實平均值到計算結果的偏差:
;
所述聚合精度半徑由權重和隱私保護度表示為:
;
其中,,計算結果收斂于中的真正平均值;
S2、基于假設檢驗進行數據可靠性驗證;
所述步驟S2中采用的數據可靠性驗證公式為零和博弈,所述零和博弈通過假設檢驗來實現,最優檢驗預支通過強化學習來學習得到,具體為:
S21、將表示為零假設,即數據是可靠的,反之,表示數據不可靠,則可靠的數據被誤判為不可靠的數據的誤報率:
;
S22、將數據可靠性驗證的所述零和博弈的納什均衡表示為,閾值用于在數據可靠性驗證中使效用最大化,而惡意參與用戶端的目標是使其效用最大化;
所述零和博弈的唯一納什均衡由下式給出:
;
其中,為預設的閾值:
;
且方程由求解;
上傳的每個數據都由維度2的實部和虛部組成,因此有:
;
;
其中,和分別是具有2個自由度的非中心參數的卡方分布和非中心卡方分布的累積分布函數;
S3、采用強化學習算法進行用戶信譽更新和聚合權重計算;
所述步驟S3采用強化學習算法Sarsa,具體為:
S31、設置信譽更新規則如下:
對
若,則信譽值隨著的增加而降低;
信譽更新函數為:
;
其中在范圍與上時,是負實數;
表示每個數據和參考值之間的絕對偏差,,而表示每個可靠數據和參考值之間的絕對偏差,,參數和由誠實的參與用戶端或惡意參與用戶端的信譽值由預設方式評估得到,且初始值均為0.5;
S32、讓表示經過數據可靠性檢驗驗證過的可靠數據集;因此,數據的聚合權重由下式給出:
;
其中:
。
2.根據權利要求1所述的一種基于強化學習的隱私保護移動群智感知方法,其特征在于,
所述一種基于強化學習的隱私保護移動群智感知方法用于不可信的聚合中心,其中的參與用戶端包括誠實客戶端與惡意客戶端。
3.根據權利要求1所述的一種基于強化學習的隱私保護移動群智感知方法,其特征在于,
每個參與用戶端上傳至融合中心的數據均為通過KL隱私進行擾動后的數據。
4.根據權利要求1所述的一種基于強化學習的隱私保護移動群智感知方法,其特征在于,
每個參與用戶端的隱私成本定義為:
其中成本參數是一個非負實數,為隱私保護度。
5.根據權利要求1所述的一種基于強化學習的隱私保護移動群智感知方法,其特征在于,
所述激勵機制公式如下:
;
;
最優隱私保護度和獎勵由融合中心的預算B、成本參數和參與用戶端數n決定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建師范大學,未經福建師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110727758.5/1.html,轉載請聲明來源鉆瓜專利網。





