[發明專利]一種數據風險評估方法和裝置有效
| 申請號: | 201811627005.1 | 申請日: | 2018-12-28 |
| 公開(公告)號: | CN111382457B | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 史文釗;弓孟春;王樂子 | 申請(專利權)人: | 神州數碼醫療科技股份有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06Q10/0635 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 逯恒 |
| 地址: | 100000 北京市海淀區蘇*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 風險 評估 方法 裝置 | ||
本申請提供了一種數據風險評估方法及裝置,其中,該方法包括:獲取脫敏數據;基于預設的多個評估標識,對所述脫敏數據進行篩選,得到與每個所述評估標識相匹配的評估數據;基于所述多個評估標識的排列組合,確定每個評估標識組合所對應的評估數據集合,其中,所述評估標識組合為所述多個評估標識中不同評估標識進行排列組合的結果;確定每個評估數據集合的風險評估影響因素;基于所述風險評估影響因素,確定獲取到的脫敏數據是否存在隱私泄露風險。這樣,通過對已經進行脫敏處理的數據進行評估,判斷脫敏數據是否還存在隱私泄露風險,可以有效對脫敏數據進行定量評估和把控,有效防止用戶的個人隱私泄露,使用戶的隱私得到更好的保護。
技術領域
本申請涉及數據風險評估技術領域,具體而言,涉及一種數據風險評估的方法和裝置。
背景技術
隨著醫療數據的快速增長,利用大樣本數據進行醫學研究是大勢所趨,目前,很多醫院或者醫生進行醫學研究時均有對大樣本醫療數據的需求。但是醫療數據屬于隱私數據,具有一定的保密性,一旦病人隱私泄露會存在巨大風險。醫院或者醫生在進行數據交換等處理時,一般都需先對數據進行脫敏處理,即對隱私數據去掉敏感標識,形成去標識化數據集,以達到保護用戶數據隱私的目的。
但是,目前對于數據進行脫敏處理,使用的脫敏方式不盡相同,沒有一個統一的脫敏方法和脫敏標準,這就導致對于不同的數據源來講,使用不同的脫敏方法得到的脫敏效果也不同,相應的,對于脫敏后的數據,也無法評估是否脫敏成功,是否足以達到可以保護用戶隱私。
發明內容
有鑒于此,本申請提供一種數據風險評估方法和裝置,可以有效對脫敏數據進行定量評估和把控,有效防止用戶的個人隱私泄露,使用戶的隱私得到更好的保護。
本申請實施例提供了一種數據風險評估方法,所述方法包括:
獲取脫敏數據;
基于預設的多個評估標識,對所述脫敏數據進行篩選,得到與每個所述評估標識相匹配的評估數據;
基于所述多個評估標識的排列組合,確定每個評估標識組合所對應的評估數據集合,其中,所述評估標識組合為所述多個評估標識中不同評估標識進行排列組合的結果;
確定每個評估數據集合的風險評估影響因素;
基于所述風險評估影響因素,確定獲取到的脫敏數據是否存在隱私泄露風險。
進一步的,所述多個評估標識包括基礎項評估標識;或者所述多個評估標識包括基礎項評估標識,以及職業評估標識、婚姻評估標識與民族評估標識中的至少一者;其中,所述基礎項評估標識包括性別評估標識、出生日期評估標識、地址評估標識。
進一步的,基于預設的多個評估標識,對所述脫敏數據進行篩選,得到與每個所述評估標識相匹配的評估數據,包括:
基于預設的多個評估標識,刪除所述脫敏數據中不符合預設識別內容的數據對應的數據組;
基于預設的多個評估標識,對脫敏數據進行規范化處理,所述規范化處理包括對數據格式進行統一處理;
基于預設的多個評估標識,對規范化處理后的脫敏數據進行編碼處理;
從處理后的數據中確定與每個所述評估標識相匹配的評估數據。
進一步的,當所述多個評估標識包括民族評估標識的時候,所述基于預設的多個評估標識,對脫敏數據進行規范化處理,所述規范化處理包括對數據格式進行統一處理,包括:
確定所述脫敏數據中的民族評估標識中除漢族之外的每個民族的數據組數量;
若所述數據組數量小于預設數量,將該數據組數量對應的民族的評估標識改為少數民族。
進一步的,所述確定每個評估數據集合的風險評估影響因素,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于神州數碼醫療科技股份有限公司,未經神州數碼醫療科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811627005.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:直播數據處理方法、裝置及終端
- 下一篇:一種駕駛員識別方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





