[發(fā)明專利]一種數(shù)據(jù)挖掘隱私保護(hù)方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201710141180.9 | 申請日: | 2017-03-10 |
| 公開(公告)號: | CN106874779A | 公開(公告)日: | 2017-06-20 |
| 發(fā)明(設(shè)計)人: | 凌捷;馬波;龔怡;柳毅;顧國生 | 申請(專利權(quán))人: | 廣東工業(yè)大學(xué) |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F17/30 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司11227 | 代理人: | 羅滿 |
| 地址: | 510062 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù) 挖掘 隱私 保護(hù) 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)挖掘隱私保護(hù)方法及系統(tǒng)。
背景技術(shù)
當(dāng)前,隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)挖掘技術(shù)得到了快速的發(fā)展,應(yīng)用范圍也越來越廣。而數(shù)據(jù)挖掘技術(shù)本身就像是一把雙刃劍,在企業(yè)和個人合理使用數(shù)據(jù)挖掘技術(shù)的情況下,能夠為日常的商業(yè)活動以及工作生活帶來積極作用。然而,如果用戶將挖掘目標(biāo)瞄準(zhǔn)個人隱私或商業(yè)機密的情況下,則很可能會導(dǎo)致隱私信息遭受泄露。
為了避免在數(shù)據(jù)挖掘過程中隱私信息遭到泄露,人們提出了基于決策樹來對數(shù)據(jù)挖掘展開隱私保護(hù),然而,現(xiàn)有用于對數(shù)據(jù)挖掘進(jìn)行隱私保護(hù)的決策樹在創(chuàng)建過程中需要消耗較多的隱私預(yù)算,并且容易導(dǎo)致最終的隱私保護(hù)效果較差。
綜上所述可以看出,如何在創(chuàng)建決策樹的過程中避免消耗過多的隱私預(yù)算并提高最終的隱私保護(hù)效果是目前有待解決的問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種數(shù)據(jù)挖掘隱私保護(hù)方法及系統(tǒng),能夠在創(chuàng)建決策樹的過程中避免消耗過多的隱私預(yù)算并提高了最終的隱私保護(hù)效果。其具體方案如下:
一種數(shù)據(jù)挖掘隱私保護(hù)方法,包括:
獲取原始數(shù)據(jù)集;
對所述原始數(shù)據(jù)集中的連續(xù)屬性進(jìn)行離散化,得到第一處理后數(shù)據(jù)集;
對所述第一處理后數(shù)據(jù)集中的屬性進(jìn)行約簡處理,得到第二處理后數(shù)據(jù)集;
對所述第二處理后數(shù)據(jù)集中的屬性進(jìn)行完全泛化處理,得到相應(yīng)的細(xì)分方案集;
對所述細(xì)分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到相應(yīng)的目標(biāo)決策樹;
利用所述目標(biāo)決策樹,對數(shù)據(jù)挖掘過程展開隱私保護(hù)。
可選的,所述對所述原始數(shù)據(jù)集中的連續(xù)屬性進(jìn)行離散化的過程,包括:
利用斷點法,對所述原始數(shù)據(jù)集中的連續(xù)屬性進(jìn)行離散化處理,得到所述第一處理后數(shù)據(jù)集。
可選的,所述對所述第一處理后數(shù)據(jù)集中的屬性進(jìn)行約簡處理的過程,包括:
創(chuàng)建與所述第一處理后數(shù)據(jù)集對應(yīng)的可辨識矩陣;
基于所述可辨識矩陣,對所述第一處理后數(shù)據(jù)集中的屬性展開約簡處理,得到所述第二處理后數(shù)據(jù)集。
可選的,所述對所述第二處理后數(shù)據(jù)集中的屬性進(jìn)行完全泛化處理的過程,包括:
對所述第二處理后數(shù)據(jù)集中數(shù)值型的離散屬性進(jìn)行直接泛化,并對所述第二處理后數(shù)據(jù)集中非數(shù)值型的離散屬性進(jìn)行逐級泛化,得到所述細(xì)分方案集。
可選的,所述對所述細(xì)分方案集展開相應(yīng)的決策樹構(gòu)建操作的過程,包括:
利用差分隱私的指數(shù)機制,對所述細(xì)分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到所述目標(biāo)決策樹。
本發(fā)明還公開了一種數(shù)據(jù)挖掘隱私保護(hù)系統(tǒng),包括:
數(shù)據(jù)集獲取模塊,用于獲取原始數(shù)據(jù)集;
屬性離散化模塊,用于對所述原始數(shù)據(jù)集中的連續(xù)屬性進(jìn)行離散化,得到第一處理后數(shù)據(jù)集;
屬性約簡模塊,用于對所述第一處理后數(shù)據(jù)集中的屬性進(jìn)行約簡處理,得到第二處理后數(shù)據(jù)集;
屬性泛化模塊,用于對所述第二處理后數(shù)據(jù)集中的屬性進(jìn)行完全泛化處理,得到相應(yīng)的細(xì)分方案集;
決策樹構(gòu)建模塊,用于對所述細(xì)分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到相應(yīng)的目標(biāo)決策樹;
隱私保護(hù)模塊,用于利用所述目標(biāo)決策樹,對數(shù)據(jù)挖掘過程展開隱私保護(hù)。
可選的,所述屬性離散化模塊,具體用于利用斷點法,對所述原始數(shù)據(jù)集中的連續(xù)屬性進(jìn)行離散化處理,得到所述第一處理后數(shù)據(jù)集。
可選的,所述屬性約簡模塊,具體用于創(chuàng)建與所述第一處理后數(shù)據(jù)集對應(yīng)的可辨識矩陣,然后基于所述可辨識矩陣,對所述第一處理后數(shù)據(jù)集中的屬性展開約簡處理,得到所述第二處理后數(shù)據(jù)集。
可選的,所述屬性泛化模塊,具體用于對所述第二處理后數(shù)據(jù)集中數(shù)值型的離散屬性進(jìn)行直接泛化,并對所述第二處理后數(shù)據(jù)集中非數(shù)值型的離散屬性進(jìn)行逐級泛化,得到所述細(xì)分方案集。
可選的,所述決策樹構(gòu)建模塊,具體用于利用差分隱私的指數(shù)機制,對所述細(xì)分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到所述目標(biāo)決策樹。
本發(fā)明中,數(shù)據(jù)挖掘隱私保護(hù)方法,包括:獲取原始數(shù)據(jù)集;對原始數(shù)據(jù)集中的連續(xù)屬性進(jìn)行離散化,得到第一處理后數(shù)據(jù)集;對第一處理后數(shù)據(jù)集中的屬性進(jìn)行約簡處理,得到第二處理后數(shù)據(jù)集;對第二處理后數(shù)據(jù)集中的屬性進(jìn)行完全泛化處理,得到相應(yīng)的細(xì)分方案集;對細(xì)分方案集展開相應(yīng)的決策樹構(gòu)建操作,得到相應(yīng)的目標(biāo)決策樹;利用目標(biāo)決策樹,對數(shù)據(jù)挖掘過程展開隱私保護(hù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學(xué),未經(jīng)廣東工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710141180.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





