[發(fā)明專利]一種基于個性化差分隱私保護(hù)的推薦方法在審
| 申請?zhí)枺?/td> | 202110642458.7 | 申請日: | 2021-06-09 |
| 公開(公告)號: | CN113204793A | 公開(公告)日: | 2021-08-03 |
| 發(fā)明(設(shè)計)人: | 張全貴;孫玲玉;李鑫 | 申請(專利權(quán))人: | 遼寧工程技術(shù)大學(xué) |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F16/9535;G06F16/9536;G06F17/16;G06K9/62 |
| 代理公司: | 北京華夏正合知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11017 | 代理人: | 韓登營;韓惠琴 |
| 地址: | 123000 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 個性化 隱私 保護(hù) 推薦 方法 | ||
本發(fā)明公開了一種基于個性化差分隱私保護(hù)的推薦方法(PDP?IR),該方法包括以下步驟:S1、數(shù)據(jù)采集及劃分;S2、基于個性化差分隱私保護(hù)的協(xié)同過濾(PPCF)算法的構(gòu)造;S3、隨機(jī)采樣;S4、隱私保護(hù)的集成推薦算法;S5、生成推薦。本發(fā)明將個性化差分隱私機(jī)制應(yīng)用到集成推薦算法中,考慮到每個用戶對各種項(xiàng)目的隱私級別的需求是不一樣的,PDP?IR方法能夠?yàn)橛脩籼峁﹤€性化隱私需求和項(xiàng)目級別的隱私保護(hù),還可以提供高質(zhì)量地推薦服務(wù)。根據(jù)個性化差分隱私的定義,從理論上證明了PDP?IR方案是滿足個性化差分隱私的,從而保證了整個方案的隱私安全。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)挖掘和自然語言處理的技術(shù)領(lǐng)域,尤其涉及一種基于個性化差分隱私保護(hù)的推薦方法。
背景技術(shù)
最近二十年中,互聯(lián)網(wǎng)上的信息呈爆炸式增長,人們不可能通過搜索所有的網(wǎng)絡(luò)信息,去尋找自己想要獲取的信息。推薦系統(tǒng)能夠?yàn)橛脩籼峁﹤€性化的內(nèi)容和服務(wù)推薦,也能提高用戶的在線服務(wù)體驗(yàn)。推薦系統(tǒng)在電子商務(wù)中已經(jīng)得到廣泛應(yīng)用,可以為用戶提供商品推薦服務(wù)。推薦系統(tǒng)中最常用的算法是協(xié)同過濾算法,該算法利用用戶的歷史行為數(shù)據(jù)為用戶產(chǎn)生推薦服務(wù)。如果攻擊者獲取到一些用戶的歷史行為數(shù)據(jù),就可以推斷出用戶的其他信息。研究者Dwork針對用戶的歷史行為信息提出了三種類型的推薦攻擊,這些攻擊會給用戶的隱私帶來極大的威脅。差分隱私是一種密碼學(xué)技術(shù),當(dāng)從統(tǒng)計數(shù)據(jù)庫查詢時,可以在保證查詢結(jié)果準(zhǔn)確性的同時,最大程度地減少識別其記錄的機(jī)會。差分隱私技術(shù)已經(jīng)被廣泛應(yīng)用于推薦系統(tǒng)中。有人提出了一種差分隱私矩陣分解機(jī)制,該機(jī)制能夠防止不可信的推薦系統(tǒng)獲取到用戶的隱私信息。其基本思想是,首先獲取不加隱私的用戶因子矩陣,將其保密存儲,然后擾動目標(biāo)函數(shù)得到加噪后項(xiàng)目因子矩陣,最后發(fā)布加噪后的項(xiàng)目因子矩陣。由于項(xiàng)目因子矩陣是滿足差分隱私的,攻擊者無法通過項(xiàng)目因子矩陣以推斷用戶的隱私信息,從而保證了用戶的隱私安全。
傳統(tǒng)的差分隱私保護(hù)方法有一個重要的限制,它只能為數(shù)據(jù)集中的所有用戶提供統(tǒng)一級別的隱私保護(hù)。這種方法忽略了一個事實(shí),每個人都會對他自己的隱私信息有不同的要求。而在實(shí)踐中,用戶對自己的隱私級別會有個性化的需求,即用戶根據(jù)自己的意愿以設(shè)置自己的隱私級別。個性化的差分隱私保護(hù),可以實(shí)現(xiàn)更高地推薦準(zhǔn)確度。因?yàn)樵趥鹘y(tǒng)的差分隱私保護(hù)中,一般會將數(shù)據(jù)集中用戶要求最高的隱私級別設(shè)置成統(tǒng)一的隱私級別,這樣會導(dǎo)致更多的噪聲,也降低了預(yù)測的準(zhǔn)確度。個性化隱私保護(hù)模型很好地解決了這個問題,它考慮到了用戶的個人隱私需求,并允許用戶指定自己隱私保護(hù)級別。基于鄰域的協(xié)同過濾算法,由于評分?jǐn)?shù)據(jù)集過于稀疏,導(dǎo)致其預(yù)測精度不高。而基于模型的矩陣分解算法只關(guān)注評分矩陣的全局信息,沒有考慮到評分矩陣的局部信息,導(dǎo)致預(yù)測評分在準(zhǔn)確度和多樣性較差。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的不足,本發(fā)明所要解決的技術(shù)問題在于提供一種基于個性化差分隱私保護(hù)的推薦方法,考慮到在實(shí)踐中用戶對自己的隱私級別會有個性化的需求,即用戶希望可以根據(jù)自己的意愿來設(shè)置自己的隱私級別,個性化的差分隱私保護(hù),在保護(hù)用戶個人隱私的前提下,還能為用戶提供高質(zhì)量地推薦服務(wù)。
為了實(shí)現(xiàn)以上技術(shù)方案,提出了一種基于個性化差分隱私的集成推薦方法,包括以下步驟:
S1、數(shù)據(jù)的采集及劃分:將處理好的數(shù)據(jù)集隨機(jī)選取80%的歷史交互作為訓(xùn)練集,用于訓(xùn)練模型;其余作為測試集,從訓(xùn)練集中隨機(jī)選取10%的交互作為驗(yàn)證集,用于調(diào)整超參數(shù);
S2、PPCF算法的構(gòu)造:個性化差分隱私的協(xié)同過濾算法通過用戶的鄰域以預(yù)測用戶評分首先利用Johnson Lindenstrauss變換的隨機(jī)預(yù)處理方法,將原始評分矩陣從高維降為低維,得到降維矩陣G;然后計算用戶間的相似度,并使用拉普拉斯噪聲擾動相似度的值,并基于擾動的相似度選取k個最近鄰域用戶;基于這k個鄰域用戶以預(yù)測評分
S3、隨機(jī)采樣:根據(jù)用戶的隱私偏好級別以決定用戶評分隨機(jī)抽樣的概率,對原始評分矩陣的數(shù)據(jù)進(jìn)行隨機(jī)抽樣,可以得到隨機(jī)抽樣后的評分矩陣DRS;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于遼寧工程技術(shù)大學(xué),未經(jīng)遼寧工程技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110642458.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F21-00 防止未授權(quán)行為的保護(hù)計算機(jī)或計算機(jī)系統(tǒng)的安全裝置
G06F21-02 .通過保護(hù)計算機(jī)的特定內(nèi)部部件
G06F21-04 .通過保護(hù)特定的外圍設(shè)備,如鍵盤或顯示器
G06F21-06 .通過感知越權(quán)操作或外圍侵?jǐn)_
G06F21-20 .通過限制訪問計算機(jī)系統(tǒng)或計算機(jī)網(wǎng)絡(luò)中的節(jié)點(diǎn)
G06F21-22 .通過限制訪問或處理程序或過程





