[發明專利]一種基于大數據的隱私數據分級保護方法在審
| 申請號: | 202011018209.2 | 申請日: | 2020-09-24 |
| 公開(公告)號: | CN112100670A | 公開(公告)日: | 2020-12-18 |
| 發明(設計)人: | 周麗君 | 申請(專利權)人: | 周麗君 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F21/60;G06F16/245 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610213 四川省成都市天府新區牧*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 隱私 分級 保護 方法 | ||
1.一種基于大數據的隱私數據分級保護方法,其特征在于:包括以下步驟:
1)獲取關鍵詞,設定隱私程度等級;將獲取的關鍵詞按照隱私程度分為不同的等級,每個隱私程度等級下有若干個關鍵詞,為每一個關鍵詞建立一個存儲目錄;
2)選取其中一個隱私程度等級內的其中一個關鍵詞對數據庫進行檢索,將使用此關鍵詞搜索到的數據歸類到此關鍵詞的存儲目錄下;
3)重復步驟2)的操作,直至遍歷步驟2)選取隱私程度等級內的全部關鍵詞;
4)重復步驟2)至步驟3)的操作,直至遍歷全部隱私程度等級;
5)對隱私程度等級高的關鍵詞的存儲目錄內存儲的數據進行加密。
2.根據權利要求1所述的基于大數據的隱私數據分級保護方法,其特征在于:在步驟1)中,獲取關鍵詞的方法為:搜索數據庫內待處理的隱私數據,提取數據庫內待處理的隱私數據中的高頻詞,將提取的高頻詞作為高頻詞集合。
3.根據權利要求2所述的基于大數據的隱私數據分級保護方法,其特征在于:在步驟1)中,將獲取的關鍵詞按照隱私程度分為不同的等級的步驟包括:
1-1)遍歷高頻詞集合中的全部高頻詞,計算高頻詞集合中任意兩個高頻詞之間的相似度;
1-2)設置相似度閾值,將相似度處于相似度閾值內的兩個高頻詞歸于同一個關鍵詞內,以此獲得全部關鍵詞;
1-3)通過數據庫服務器獲取外部服務器訪問每個關鍵詞的訪問頻次;
1-4)依據關鍵詞的訪問頻次,計算包含此關鍵詞的數據的訪問信任度;
1-5)計算步驟1-2)獲得的全部關鍵詞中任意兩個關鍵詞之間的相似度,建立鄰近關系矩陣;
1-6)通過關鍵詞鄰近關系矩陣,得到關鍵詞在鄰近關系矩陣內受到相鄰關鍵詞的影響關系,獲得關鍵詞在鄰近關系矩陣內的特征向量;
1-7)建立關鍵詞的敏感度查詢函數,計算關鍵詞的敏感度值;
1-8)以關鍵詞的敏感度值為標準,判斷關鍵詞的隱私度,并將全部關鍵詞分為不同的隱私等級。
4.根據權利要求3所述的基于大數據的隱私數據分級保護方法,其特征在于:在步驟1-1)中,計算高頻詞集合中任意兩個高頻詞之間的相似度時,包括以下步驟:
1-1-1)分別找出兩個高頻詞所在的數據;
1-1-2)計算兩個高頻詞在其所在數據中的詞頻,分別生成兩個高頻詞所在的數據的詞頻向量;
1-1-3)計算兩個高頻詞的詞頻向量的余弦相似度;
在步驟1-2)中,將步驟1-1-3)中計算的高頻詞的詞頻向量的余弦相似度數值作為兩個高頻詞的相似度。
5.根據權利要求3所述的基于大數據的隱私數據分級保護方法,其特征在于:步驟1-4)中,依據關鍵詞的訪問頻次,計算包含此關鍵詞的數據的訪問信任度;將訪問信任度表示為:αFu,i+1>0是一個關于Fu,i的單調遞增函數,Fu,i為關鍵詞i的被訪問頻次,Wu,i為關鍵詞i的訪問信任度。
6.根據權利要求3所述的基于大數據的隱私數據分級保護方法,其特征在于:步驟1-5)中,步驟1-2)獲得的全部關鍵詞中任意兩個關鍵詞之間的相似度的過程包括:
找到包含這兩個關鍵詞的數據,計算這兩個關鍵詞在包含這兩個關鍵詞的數據中的詞頻,分別生成包含這兩個關鍵詞的數據的詞頻向量;
計算包含這兩個關鍵詞的數據的詞頻向量的余弦相似度,以包含這兩個關鍵詞的數據的詞頻向量的余弦相似度作為這兩個關鍵詞的相似度;
以上述步驟計算出的關鍵詞的相似度為基礎,以相似度高的兩個關鍵詞為兩個相鄰元,建立鄰近關系矩陣。
7.根據權利要求6所述的基于大數據的隱私數據分級保護方法,其特征在于:在步驟1-6)中,關鍵詞在鄰近關系矩陣內的特征向量表示為:其中,是鄰近關系矩陣內所有關鍵詞的相似度的歸一化值,L(i)表示關系矩陣內關鍵詞i相鄰的關鍵詞的集合,sim(i,j)表示關鍵詞i和關鍵詞j的相似度,表示關鍵詞i的特征向量。
8.根據權利要求6所述的基于大數據的隱私數據分級保護方法,其特征在于:步驟1-7)中,敏感度查詢函數表示為:其中,為關鍵詞i的第n個高頻詞的敏感度函數,關鍵詞i為包括n個高頻詞的數集,n和n-1為關鍵詞i中的兩個高頻詞,f(n)為高頻詞n想關于關鍵詞i的一個單調遞增函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于周麗君,未經周麗君許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011018209.2/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





