[發明專利]一種社交媒體用戶行為時間模式的自適應隱私保護方法有效
| 申請號: | 201710706006.4 | 申請日: | 2017-08-17 |
| 公開(公告)號: | CN107688751B | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 曾劍平;張澤文 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;陸尤 |
| 地址: | 200433 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 社交 媒體 用戶 行為 時間 模式 自適應 隱私 保護 方法 | ||
本發明屬于互聯網社交媒體技術領域,具體為社交媒體用戶行為時間模式的自適應隱私保護方法。本發明方法包含自適應時間粒度選擇方法和自適應微聚集隱私保護算法Ada?MAPP。在用戶行為時間模式的處理上,根據社交媒體的活躍度不同,自適應地選擇合適的時間粒度;以社交媒體用戶行為的時間模式和匿名度參數作為輸入,通過Ada?MAPP,根據信息損失的比較,決定候選點是否加入既有類中。Ada?MAPP對用戶行為模式數據進行由外向內的聚類,最后用質心替代原始數據實現匿名保護,得到隱私保護數據。本發明能夠適應于不同活躍度的社交媒體;在保證匿名度的前提下,減少隱私保護所產生的信息損失,提升隱私數據的可用性。
技術領域
本發明屬于互聯網社交媒體技術領域,具體涉及社交媒體用戶行為時間模式的自適應隱私保護方法。
背景技術
伴隨著微博、網絡論壇等傳統的社交媒體以及微信、Facebook、Twitter等新興社交媒體的出現,人們進入了社交媒體時代。社交媒體的快速興起加速了信息的流動,使得人與人之間的溝通變得越來越便捷。馮登國等人指出,隨著非結構化數據、社交網絡數據的激增,以及云計算、移動計算的快速發展,當前數據處理量動輒幾PB,而全球數據量也已增長到ZB級[1]。大數據技術的發軔正是源于用戶對海量數據的采集、存儲、管理、分析以及持久性的需求,因此這是順應用戶需求的產物。
龐大的數據量也導致了大數據安全問題,需要通過隱私保護技術來解決。究其原因,隨著網絡技術的快速發展和用戶在網絡中的參與度的極大提高,對于每一個個體,都存在著與之相關的網絡信息,這些相關信息的存量不斷累積,攻擊者就可以通過相關信息的不同組合來挖掘隱私,導致隱私泄露。例如,用戶在網絡社交媒體上的發貼、回帖等行為都會留下時間戳信息,由此構成的時間模式在很大程度上反映了個人的行為特點,因此容易導致個人隱私泄露。
隨著互聯網安全與隱私的關注度越來越高,國內外關于隱私保護技術的研究也越來越多。隱私保護技術的主要研究方向包括通用的隱私保護技術、面向數據挖掘的隱私保護技術、基于隱私保護的數據發布、隱私保護算法等[2]。通用的隱私保護技術致力于在較低應用層次上保護數據的隱私,一般通過引入統計模型和概率模型來實現;面向數據挖掘的隱私保護技術主要解決在高層數據應用中,如何根據不同數據挖掘操作的特性,實現對隱私保護;基于隱私保護的數據發布是為了提供一種在各類應用中可以通用的隱私保護方法,進而使得在此基礎上設計的隱私保護算法也具有通用性。作為新興的研究熱點,隱私保護技術不論在理論研究還是實際應用方面,都具有非常重要的價值。
傳統隱私保護算法的保護對象主要是用戶的身份信息、地理位置信息、疾患信息、社會聯系信息等,但是,對于社交媒體中的用戶行為時間模式的隱私保護的研究還比較少。用戶行為時間模式這種新的數據類型在當今網絡飛速發展的時代顯得越來越突出。首先,當前社會中的各項工作都越來越趨向于無紙化,各類信息通過電子系統、社交媒體等方式記錄到存儲介質中,而這種記錄的行為是由特定的個體來執行的,特定的個體具備特定的時間模式;其次,特定個體參與的各種電子系統、社交媒體的種類越來越多,會在這些平臺上留痕,而其中的時間模式是可以公開獲取的,這種時間模式可能成為連接各平臺、侵害特定個體隱私的準標識符。
雖然以往的算法,如MDAV算法、V-MDAV算法、IV-MDAV算法[3,4],在某種程度上可以處理這種時間模式數據,但是直接使用這些算法來進行時間行為模式的隱私保護,會造成較大的信息損失,降低數據可用性。在MDAV之類的微聚集算法中,當找到整個元信息集的質心后,需要尋找距離質心最遠的第一候選點,和距離第一候選點最遠的第二候選點,然后同時考慮第一、第二候選點的聚類問題。這種設計雖然在某種程度上加快了算法的執行效率,但這卻是以犧牲算法的整體性為代價的。主要原因是,若同時考慮兩個候選點的聚類問題,就無法準確找出單個聚類的信息損失與元信息集整體信息損失之間的關系,同時,也無法判斷這兩個聚類相互影響的程度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710706006.4/2.html,轉載請聲明來源鉆瓜專利網。





