[發(fā)明專利]一種基于聯(lián)邦學習的上下文感知推薦系統(tǒng)及方法有效
| 申請?zhí)枺?/td> | 202110192913.8 | 申請日: | 2021-02-20 |
| 公開(公告)號: | CN112836130B | 公開(公告)日: | 2023-02-03 |
| 發(fā)明(設計)人: | 邵杰;阿里·瓦格爾;王衍松;鄧智毅 | 申請(專利權)人: | 四川省人工智能研究院(宜賓) |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/9536;G06F16/35;G06F21/62;G06Q30/0601;G06N20/00 |
| 代理公司: | 北京正華智誠專利代理事務所(普通合伙) 11870 | 代理人: | 楊浩林 |
| 地址: | 644000 四川省宜賓市臨*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聯(lián)邦 學習 上下文 感知 推薦 系統(tǒng) 方法 | ||
本發(fā)明公開了一種基于聯(lián)邦學習的上下文感知推薦系統(tǒng)及方法,提出用戶自定義數(shù)據(jù)協(xié)作協(xié)議模塊,通過該模塊對用戶評分數(shù)據(jù)和上下文信息進行拼接,得到含有上下文信息的用戶數(shù)據(jù)并將其發(fā)送至客戶端。客戶端根據(jù)用戶數(shù)據(jù)和服務端權重參數(shù)訓練本地推薦模型,并將本地模型權重參數(shù)發(fā)送至中央服務器。中央服務器聚合所有客戶端的本地模型權重參數(shù),得到新的服務端權重參數(shù),完成一輪訓練。多次訓練本地推薦模型,直到本地推薦模型收斂。訓練完成的本地推薦模型用于對新的用戶數(shù)據(jù)進行處理,得到對用戶的推薦內容。本發(fā)明通過將聯(lián)邦學習技術應用在推薦系統(tǒng)中,并且在推薦系統(tǒng)中結合了上下文信息,實現(xiàn)了在保護用戶隱私的同時也擁有較高的推薦準確率。
技術領域
本發(fā)明涉及推薦系統(tǒng)領域,具體涉及一種基于聯(lián)邦學習的上下文感知推薦系統(tǒng)及方法。
背景技術
在推薦系統(tǒng)領域,傳統(tǒng)的隱私保護方法主要有數(shù)據(jù)匿名化、加密技術和差分隱私。數(shù)據(jù)匿名化技術是對數(shù)據(jù)集中的數(shù)據(jù)進行匿名化處理的一種方法,它首先將每條數(shù)據(jù)的屬性分為3類,唯一標識個體的標識屬性,聯(lián)合起來可以確定個體的準標識屬性以及需要被保護的敏感屬性。匿名化處理后的數(shù)據(jù)集將被隱去標識屬性,同時對準標識屬性進行一定程度的模糊化(如把年齡改為范圍,郵編除去后兩位等),使敏感數(shù)據(jù)得到保護,但是由于沒有對敏感數(shù)據(jù)做任何約束,攻擊者可以通過掌握的背景知識攻擊個體隱私,并且匿名化程度越高的數(shù)據(jù),數(shù)據(jù)的損失就越多,其可用性就越差。加密技術所需額外的計算成本較大、步驟較為繁瑣,總體的資源利用率較低。差分隱私技術是近幾年較為流行的隱私保護方法,其通過對數(shù)據(jù)集加入噪聲,使得即使數(shù)據(jù)集發(fā)生小范圍的改動,對其查詢得到的結果值的概率分布基本不變,有效防止了差分攻擊所造成的信息泄露。但是,和數(shù)據(jù)匿名化有些相似,差分隱私需要在查詢結果中加入大量的隨機化,導致數(shù)據(jù)的可用性急劇下降,數(shù)據(jù)所含信息受損。
傳統(tǒng)的隱私保護方法確實對用戶數(shù)據(jù)起到了一定的保護作用,但是當這些方法應用在推薦系統(tǒng)中時會造成巨大的計算開銷,結果的精確度也受到了較大的影響,不能很好的貼合推薦算法等人工智能算法的訓練迭代升級過程。而近幾年發(fā)展迅速的聯(lián)邦學習正是一種適用于深度學習中隱私保護的訓練框架。它由谷歌研究員McMahan等人于2016年提出。最初用于在用戶數(shù)據(jù)不離開本地的情況下訓練一個手機輸入預測模型。后來,其中心思想經(jīng)過提煉后被稱為聯(lián)邦學習。聯(lián)邦學習假設有多個訓練參與方和一個中心服務器,由中心服務器將模型分發(fā)給各個參與方,參與方只需要在本地進行訓練,將更新后的模型參數(shù)返還給中心服務器即可完成一個模型更新過程。聯(lián)邦學習保證了用戶數(shù)據(jù)不離開用戶本地存儲設備,大大提高了對隱私的保護能力。
此外,在推薦系統(tǒng)領域,上下文感知推薦系統(tǒng)得到了廣泛的關注。它指出,用戶的選擇不僅取決于興趣相似的人,還與選擇特定物品時的背景信息密切相關,如選擇時的時間、位置、社交互動等。作為一個早期的代表工作,‘Adomavicius G,Sankaranarayanan R,Sen S,et al.Incorporating contextual information in recommender systems usinga multidimensional approach[J].ACM Transactions on Information Systems(TOIS),2005,23(1):103-145.’引入了上下文信息的重要性和一種多維方法來將上下文信息納入推薦過程。同時,數(shù)據(jù)集的時間動態(tài)性對于推薦結果的重要性也逐漸被注意到,一些將時間特征集成到推薦模型中的工作也取得了不錯的結果。最近,許多研究人員利用深度學習的優(yōu)勢進行基于上下文的推薦。除了深度學習模型中上下文信息的重要性之外,從用戶的角度來看,隱私泄露是主要的缺點。如果推薦系統(tǒng)能夠完全訪問所有的上下文屬性,攻擊者能夠集體獲取或推斷這些信息,那么會產(chǎn)生嚴重的后果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川省人工智能研究院(宜賓),未經(jīng)四川省人工智能研究院(宜賓)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110192913.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





