[發明專利]一種基于郵件數據的隱私保護鏈接預測方法及系統有效
| 申請號: | 202210066876.0 | 申請日: | 2022-01-20 |
| 公開(公告)號: | CN114513337B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 王勇;王范川;王曉虎;秦瑞;張應福;石錕 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;H04L51/42;G06N3/042;G06N3/094 |
| 代理公司: | 成都金英專利代理事務所(普通合伙) 51218 | 代理人: | 袁英 |
| 地址: | 610041 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 郵件 數據 隱私 保護 鏈接 預測 方法 系統 | ||
本發明公開了一種基于郵件數據的隱私保護鏈接預測方法及系統,方法包括:使用郵件數據構建人物關系知識圖譜;利用生成對抗網絡訓練一個生成模型用于學習的訓練數據的分布;重構多元關系數據從而混淆數據中所隱含的敏感與非敏感關系信息;使用重構的多元關系數據補全實體之間的關系,達到在補全實體之間非敏感關系的同時,保護了實體之間敏感關系。本發明還提供了一種基于郵件數據的隱私保護鏈接預測系統實現上述方法。本發明用重構的多元關系數據補全實體之間的關系,達到在補全實體之間非敏感關系的同時,保護了實體之間敏感關系的目的,解決了現有鏈接預測技術中存在的郵件系統下人員社交關系得不到保護的技術問題。
技術領域
本發明涉及對抗學習、圖網絡表示學習、知識圖譜和鏈接預測技術領域,尤其涉及一種基于郵件數據的隱私保護鏈接預測方法及系統。
背景技術
郵件作為互聯網的應用之一,是現代社會重要的信息交流方式之一。郵件數據記錄了人們通信的內容,包含了通信關系、通信時間、通信頻率等重要信息。通過簡單地實體關系抽取和數據挖掘,可以對一個郵件數據建立多個知識圖譜。比如以校園學生郵件系統舉例:從通信關系角度可以對其建立通信關系圖譜,從線上設備登錄角度可以對其建立線上登錄行為圖譜。對在這樣的圖譜中,節點對應著實體,邊對應著關系,我們將其表示為,每一個這樣的三元組都表示實體和實體之間存在這樣的關系。
近年來,知識圖的研究取得了巨大的進展。然而,知識圖的不完全性在一定程度上影響了它的應用。針對這一問題,提出了一系列知識圖嵌入模型。其中,模型可以生成實體和關系的嵌入表示,并可以用于鏈接預測,即預測現有實體之間的關系。但這種方式造成了一些問題。任何攻擊者利用生成的嵌入進行鏈接預測,都可以獲得準確的實體之間的關系。然而,其中一些關系可能是敏感信息,我們不希望別人獲得。因此,我們不能直接使用嵌入,而是需要進行一些處理來實現隱私保護,這里我們將這些關系視為敏感信息。
現有的隱私保護技術主要分為以下幾類。第一種類型是差分隱私,主要通過對原始數據或參數或結果添加噪聲來達到隱私保護的目的。常用的拉普拉斯機制和指數機制在實現差分隱私時,會造成很高的實用損失。基于這種情況,徐等人提出了一種基于矩陣分解的差分隱私網絡嵌入方法,該方法引入了足夠的噪聲來保證隱私,但不適用于鏈路預測。Kearns等人提出了一個模型來保護一些節點,但這并不適用于鏈路預測場景。Abir?De等人引入了排序算法,該算法對非私有鏈接預測系統的基本評分進行單調變換,然后加入噪聲,可以更有效地權衡隱私和預測性能。Javier等人提出了一種添加或刪除條目的方法,以最小化隱私風險。隱私保護可以通過刪除或添加特定的邊緣來實現,但這可能會影響對剩余非敏感關系的預測。此外,簡單刪除敏感信息也容易受到推理攻擊。第二類是加密技術。基于加密的隱私保護方案通過先進的加密技術實現隱私保護。經典的加密技術包括同態加密和安全多方計算等。它們可以有效地實現隱私保護,但計算量總是很高。最后一類是GAN,通過生成對抗網絡訓練嵌入。李開陽等人提出了,這是一個圖對抗訓練框架,集成了隱私剝離和清除機制以避免推理攻擊。其中,對抗自編碼(AAE)采用生成對抗網絡(GAN)進行變化地推斷,將隱藏碼的后驗分布強制為指定的先驗分布,使得有監督的分離能力能夠保護隱私。然而,GAN訓練仍然存在一些問題,如訓練不穩定等。
發明內容
本發明的目的在于克服現有技術的不足,提供一種基于郵件數據的隱私保護鏈接預測方法及系統,旨在解決現有鏈接預測技術中存在的郵件系統下人員社交關系得不到保護的技術問題,保證了生成樣本的多樣性,在非敏感關系的預測方面,隱私保護更好且計算量比加密技術小。
本發明的目的是通過以下技術方案來實現的:
一種基于郵件數據的隱私保護鏈接預測方法,包括:
步驟一:對郵件數據進行預處理,挖掘郵件中的隱含關系,構建基于郵件數據的人物關系知識圖譜;
步驟二:利用基于能量的學習實體低維嵌入模型對人物關系知識圖譜中的實體和隱含關系進行編碼,獲得不同實體之間存在一對一關系的嵌入空間和嵌入數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210066876.0/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





