[發明專利]一種數據處理方法及裝置有效
| 申請號: | 202110339521.X | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN113032399B | 公開(公告)日: | 2022-08-30 |
| 發明(設計)人: | 趙子潤;余恪平;林昭文;孫溢 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/245;G06F16/27;G06F21/62 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 馬敬;趙元 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 裝置 | ||
本發明實施例提供了一種數據處理方法及裝置,當接收到針對目標屬性的查詢請求時,從預設存儲空間中的各數據表單中,確定查詢請求所請求的時間段對應的數據表單,作為第一數據表單;確定第一數據表單的差分預算;獲取目標屬性針對第一數據表單的優先級值、訪問次數和數據量級;基于第一數據表單的差分預算、目標屬性針對第一數據表單的優先級、訪問次數和數據量級,確定目標屬性的差分預算;按照目標屬性的差分預算,在目標屬性針對第一數據表單的查詢結果中添加噪聲,得到目標查詢結果。基于上述處理,可以提高在各屬性的查詢結果中添加的噪聲的有效性。
技術領域
本發明涉及數據安全技術領域,特別是涉及一種數據處理方法及裝置。
背景技術
基于w-事件型差分隱私保護技術的數據查詢方法,在接收到針對目標屬性的查詢請求時,從多個數據表單中確定該查詢請求所請求的時間段對應的數據表單,作為目標數據表單。每一數據表單中均記錄有多個用戶的屬性,例如,用于記錄人臉特征的數據表單中,針對每一人臉特征,該數據表單中記錄有各用戶是否具有該人臉特征。然后,計算目標數據表單的差分預算,進而,按照目標數據表單的差分預算,在目標屬性針對目標數據表單的查詢結果中添加噪聲,得到目標屬性的目標查詢結果。
現有技術中,可以基于BD(Budget Distribution,預算分配)算法,計算各數據表單各自的差分預算。具體的,可以基于預設的滑動窗口,按照各數據表單生成時間的先后順序,從各數據表單中選取相鄰的前第一數目個數據表單,作為第一數據表單。然后,計算待分配的差分預算(例如,ε/2)與1/2的乘積(即ε/4),作為第一個第一數據表單的差分預算,并計算待分配的差分預算與已分配的差分預算(即第一個第一數據表單的差分預算)的差值,得到當前剩余的差分預算(即ε/4)。然后,計算第二個第一數據表單與第一個第一數據表單的MAE(Mean Absolute Error,平均絕對誤差)。如果計算得到的MAE不小于預設閾值,計算當前剩余的差分預算與1/2的乘積(即ε/8),作為第二個第一數據表單的差分預算,并計算待分配的差分預算與已分配的差分預算(即前兩個第一數據表單的差分預算)的差值,得到當前剩余的差分預算,計算第三個第一數據表單與第二個第一數據表單的MAE,并繼續判斷計算得到的MAE是否小于預設閾值,以此類推,可以確定各第一數據表單各自的差分預算。
然后,基于預設的滑動窗口,按照各數據表單生成時間的先后順序,從多個數據表單中選取第一個數據表單后相鄰的第一數目個數據表單,作為第二數據表單。此時,計算最后一個第二數據表單與其前一個第二數據表單的MAE,如果計算得到的MAE不小于預設閾值,計算各已分配差分預算的第二數據表單的差分預算的和值,作為第一和值。計算待分配的差分預算與第一和值的差值,得到當前剩余的差分預算,并計算當前剩余的差分預算與1/2的乘積,作為最后一個第二數據表單的差分預算。
然后,基于預設的滑動窗口,按照各數據表單生成時間的先后順序,從多個數據表單中選取第二個數據表單后相鄰的第一數目個數據表單,作為第三數據表單,并計算最后一個第三數據表單的差分預算,以此類推,可以確定各數據表單各自的差分預算。
可見,計算出的差分預算是與數據表單相對應的,也就是說,同一數據表單內各屬性的差分預算是相同的。然而,一個數據表單中具有各屬性的用戶的數目是不同的,例如,具有第一屬性的用戶的數目較少,而具有第二屬性的用戶的數目較多。針對第一屬性的第一查詢結果和第二屬性的第二查詢結果,若均使用該數據表單的差分預算,對第一查詢結果和第二查詢結果添加噪聲,則會導致對第一查詢結果添加的噪聲較大,導致第一屬性的目標查詢結果的可靠性低,或者,對第二查詢結果添加的噪聲較小,會導致第二屬性的目標查詢結果的安全性較低?,F有技術的在各屬性的查詢結果中添加的噪聲的有效性較低。
發明內容
本發明實施例的目的在于提供一種數據處理方法及裝置,以提高在各屬性的查詢結果中添加的噪聲的有效性。具體技術方案如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110339521.X/2.html,轉載請聲明來源鉆瓜專利網。





