[發(fā)明專利]大數(shù)據(jù)脫敏方法在審
| 申請?zhí)枺?/td> | 202010675130.0 | 申請日: | 2020-07-14 |
| 公開(公告)號: | CN111814187A | 公開(公告)日: | 2020-10-23 |
| 發(fā)明(設(shè)計(jì))人: | 臧其事;趙可欣;吳曉峰 | 申請(專利權(quán))人: | 中國農(nóng)業(yè)銀行股份有限公司上海市分行 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06Q40/02;G06F7/58;G06F17/16 |
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 陸嘉 |
| 地址: | 200120*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 方法 | ||
1.一種大數(shù)據(jù)脫敏方法,其特征在于,對多維度事實(shí)表中的指定數(shù)據(jù)進(jìn)行脫敏,包括:
初始化步驟,讀取多維度事實(shí)表中的指定數(shù)據(jù)并排列為一個(gè)數(shù)據(jù)矩陣,數(shù)據(jù)矩陣中的每一列對應(yīng)一個(gè)維度,該數(shù)據(jù)矩陣為原始數(shù)據(jù)矩陣;
空間變換步驟,按照列對每一個(gè)維度的指定數(shù)據(jù)進(jìn)行變換,所述變換包括拉伸變換、收縮變換或者扭曲變換,得到經(jīng)變換的數(shù)據(jù)矩陣;
其中,經(jīng)歸一化處理后,經(jīng)變換的數(shù)據(jù)矩陣中的各個(gè)數(shù)據(jù)的值與原始數(shù)據(jù)矩陣中的對應(yīng)數(shù)值的差異小于5%。
2.如權(quán)利要求1所述的大數(shù)據(jù)脫敏方法,其特征在于,
所述拉伸變換包括:
生成一列隨機(jī)放大系數(shù),隨機(jī)放大系數(shù)的數(shù)量與對應(yīng)的列中的指定數(shù)據(jù)的數(shù)量相同,該列隨機(jī)放大系數(shù)滿足正態(tài)分布;
將該列指定數(shù)據(jù)與該列隨機(jī)放大系數(shù)相乘,得到經(jīng)拉伸變換的列;
所述收縮變換包括:
生成一列隨機(jī)收縮系數(shù),隨機(jī)收縮系數(shù)的數(shù)量與對應(yīng)的列中的指定數(shù)據(jù)的數(shù)量相同,該列隨機(jī)收縮系數(shù)滿足正態(tài)分布;
將該列指定數(shù)據(jù)與該列隨機(jī)收縮系數(shù)相乘,得到經(jīng)收縮變換的列。
3.如權(quán)利要求1所述的大數(shù)據(jù)脫敏方法,其特征在于,所述扭曲變換包括:
生成一Sigmod函數(shù);
生成一列隨機(jī)附加系數(shù),隨機(jī)附加系數(shù)的數(shù)量與對應(yīng)的列中的指定數(shù)據(jù)的數(shù)量相同,該列隨機(jī)附加系數(shù)滿足正態(tài)分布;
使用所述Sigmod函數(shù)對該列指定數(shù)據(jù)進(jìn)行運(yùn)算,運(yùn)算的結(jié)果與對應(yīng)的隨機(jī)附加系數(shù)共同得到經(jīng)扭曲變換的列。
4.如權(quán)利要求1所述的大數(shù)據(jù)脫敏方法,其特征在于,根據(jù)對每一個(gè)維度的指定數(shù)據(jù)的變換,生成一變換矩陣,變換矩陣中的每一列對應(yīng)指定數(shù)據(jù)的一個(gè)維度,將變換矩陣與原始數(shù)據(jù)矩陣相乘得到經(jīng)變換的數(shù)據(jù)矩陣。
5.如權(quán)利要求1所述的大數(shù)據(jù)脫敏方法,其特征在于,還包括:對多維度事實(shí)表中除了指定數(shù)據(jù)之外的其余數(shù)據(jù)進(jìn)行加密。
6.一種分布式大數(shù)據(jù)脫敏方法,其特征在于,在分布式框架下對多維度事實(shí)表中的指定數(shù)據(jù)進(jìn)行脫敏,包括:
映射步驟,由映射器讀取多維度事實(shí)表中的數(shù)據(jù)并排列為一個(gè)數(shù)據(jù)矩陣,數(shù)據(jù)矩陣中的每一列對應(yīng)一個(gè)維度,每一個(gè)維度使用一個(gè)獨(dú)立的映射器,該數(shù)據(jù)矩陣為未篩選數(shù)據(jù)矩陣;
篩選步驟,對未篩選數(shù)據(jù)矩陣進(jìn)行篩選,選擇指定數(shù)據(jù)所在的列形成原始數(shù)據(jù)矩陣,除了指定數(shù)據(jù)之外的其余數(shù)據(jù)形成輔助數(shù)據(jù)矩陣;
空間變換步驟,按照列對每一個(gè)維度的指定數(shù)據(jù)進(jìn)行變換,所述變換包括拉伸變換、收縮變換或者扭曲變換,每一個(gè)維度的變換使用獨(dú)立的歸約器進(jìn)行處理,歸約后得到經(jīng)變換的數(shù)據(jù)矩陣,其中,經(jīng)歸一化處理后,經(jīng)變換的數(shù)據(jù)矩陣中的各個(gè)數(shù)據(jù)的值與原始數(shù)據(jù)矩陣中的對應(yīng)數(shù)值的差異小于5%;
數(shù)據(jù)合并步驟,將輔助數(shù)據(jù)矩陣中的數(shù)據(jù)進(jìn)行加密,經(jīng)加密后的輔助數(shù)據(jù)矩陣和經(jīng)變換的數(shù)據(jù)矩陣合并,生成脫敏數(shù)據(jù)矩陣。
7.如權(quán)利要求6所述的分布式大數(shù)據(jù)脫敏方法,其特征在于,
所述拉伸變換包括:
生成一列隨機(jī)放大系數(shù),隨機(jī)放大系數(shù)的數(shù)量與對應(yīng)的列中的指定數(shù)據(jù)的數(shù)量相同,該列隨機(jī)放大系數(shù)滿足正態(tài)分布;
將該列指定數(shù)據(jù)與該列隨機(jī)放大系數(shù)相乘,得到經(jīng)拉伸變換的列;
所述收縮變換包括:
生成一列隨機(jī)收縮系數(shù),隨機(jī)收縮系數(shù)的數(shù)量與對應(yīng)的列中的指定數(shù)據(jù)的數(shù)量相同,該列隨機(jī)收縮系數(shù)滿足正態(tài)分布;
將該列指定數(shù)據(jù)與該列隨機(jī)收縮系數(shù)相乘,得到經(jīng)收縮變換的列。
8.如權(quán)利要求6所述的分布式大數(shù)據(jù)脫敏方法,其特征在于,所述扭曲變換包括:
生成一Sigmod函數(shù);
生成一列隨機(jī)附加系數(shù),隨機(jī)附加系數(shù)的數(shù)量與對應(yīng)的列中的指定數(shù)據(jù)的數(shù)量相同,該列隨機(jī)附加系數(shù)滿足正態(tài)分布;
使用所述Sigmod函數(shù)對該列指定數(shù)據(jù)進(jìn)行運(yùn)算,運(yùn)算的結(jié)果與對應(yīng)的隨機(jī)附加系數(shù)共同得到經(jīng)扭曲變換的列。
9.如權(quán)利要求6所述的分布式大數(shù)據(jù)脫敏方法,其特征在于,歸約器根據(jù)對每一個(gè)維度的指定數(shù)據(jù)的變換生成一列變換矩陣,歸約器將該列變換矩陣與原始數(shù)據(jù)矩陣中對應(yīng)的一列指定數(shù)據(jù)相乘得到經(jīng)變換的數(shù)據(jù)矩陣中對應(yīng)的一列數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國農(nóng)業(yè)銀行股份有限公司上海市分行,未經(jīng)中國農(nóng)業(yè)銀行股份有限公司上海市分行許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010675130.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種可替換探頭的便攜式醫(yī)療檢測儀及其控制方法
- 下一篇:高爾夫球夾
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





