[發(fā)明專利]一種保留分布特征的姓名脫敏方法有效
| 申請?zhí)枺?/td> | 201910366230.2 | 申請日: | 2019-05-05 |
| 公開(公告)號: | CN110175468B | 公開(公告)日: | 2020-12-01 |
| 發(fā)明(設(shè)計(jì))人: | 張江鑫;張名民;李建元;蔣立靚;沈曉宇;錢裕佳 | 申請(專利權(quán))人: | 浙江工業(yè)大學(xué);銀江股份有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 杭州斯可睿專利事務(wù)所有限公司 33241 | 代理人: | 王利強(qiáng) |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 保留 分布 特征 姓名 方法 | ||
1.一種保留分布特征的姓名脫敏方法,其特征在于,所述方法包括如下步驟:
(1)收集待脫敏姓名數(shù)據(jù);
(2)判斷待脫敏姓名數(shù)據(jù)是否符合規(guī)范,將異常數(shù)據(jù)放入異常數(shù)據(jù)集單獨(dú)處理;
(3)對合規(guī)的待脫敏數(shù)據(jù)進(jìn)行抽樣統(tǒng)計(jì),對姓、名生成概率密度區(qū)間,分級設(shè)置權(quán)重生成概率密度權(quán)重區(qū)間;
(4)針對具體待脫敏姓名,分別判斷姓和名所在概率密度區(qū)間的級別,然后將姓名中的字分別轉(zhuǎn)化為Unicode碼,計(jì)算姓、名脫敏后所在的區(qū)間系數(shù):
fNamecoef=(2*Unicode1+Unicode2+Unicode3)mod L1
lName1coef=(Unicode1+2*Unicode2+Unicode3)mod L2
lName2coef=(Unicode1+Unicode2+2*Unicode3)mod L3
其中L1、L2、L3為對應(yīng)級別的概率密度權(quán)重區(qū)間的總長度;
(5)根據(jù)(4)所得出的系數(shù)結(jié)合各級別的概率密度權(quán)重區(qū)間表得出脫敏后的名字。
2.如權(quán)利要求1所述的一種保留分布特征的姓名脫敏方法,其特征在于,所述異常數(shù)據(jù),是指長度小于或等于1位及長度大于5位的姓名數(shù)據(jù)。
3.如權(quán)利要求1所述的一種保留分布特征的姓名脫敏方法,其特征在于,所述(3)的過程如下:
(3.1)將待脫敏姓名數(shù)據(jù)轉(zhuǎn)化為長度為n的一維數(shù)組作為抽樣的樣本空間:
Name=[name1,name2,name3,...,namen]
(3.2)根據(jù)樣本空間Name大小確定抽樣數(shù)據(jù)集大小,建立均勻隨機(jī)采樣樣本,對樣本中的姓名進(jìn)行分割,分割成姓和其余字,分別統(tǒng)計(jì)生成概率密度表,根據(jù)概率分級設(shè)置權(quán)重,并設(shè)置每個姓的概率密度權(quán)重區(qū)間為[前面所有姓的權(quán)重之和,當(dāng)前姓權(quán)重加上前面所有姓的權(quán)重之和),每個字的概率密度權(quán)重區(qū)間為[前面所有字的權(quán)重之和,當(dāng)前字權(quán)重加上前面所有字的權(quán)重之和)。
4.如權(quán)利要求3所述的一種保留分布特征的姓名脫敏方法,其特征在于,所述建立均勻隨機(jī)采樣樣本,具體為:
設(shè)置產(chǎn)生均勻隨機(jī)數(shù)的混合線性同余發(fā)生器:
Xi+1=(aXi+c)mod m, i≥0. 公式1
設(shè)置參數(shù)a、c、m及初始值X0代入公式1進(jìn)行計(jì)算,根據(jù)拒絕采樣原理,生成均勻隨機(jī)序列:
[X0,X1,X2,...,Xk]
其中,k表示均勻隨機(jī)序列的長度;
以產(chǎn)生的均勻隨機(jī)數(shù)作為索引,在樣本空間中查找對應(yīng)的姓名,形成均勻隨機(jī)采樣樣本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué);銀江股份有限公司,未經(jīng)浙江工業(yè)大學(xué);銀江股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910366230.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計(jì)算機(jī)或計(jì)算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計(jì)算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計(jì)算機(jī)系統(tǒng)或計(jì)算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程





