[發明專利]信息處理方法、裝置、設備及介質在審

申請號：	202010740950.3	申請日：	2020-07-28
公開（公告）號：	CN112052458A	公開（公告）日：	2020-12-08
發明（設計）人：	王蜀洪;王天雨	申請（專利權）人：	華控清交信息科技（北京）有限公司
主分類號：	G06F21/60	分類號：	G06F21/60;G06F21/62
代理公司：	北京潤澤恒知識產權代理有限公司 11319	代理人：	莎日娜
地址：	100084 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	信息處理方法裝置設備介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例提供了一種信息處理方法、裝置、設備及介質，旨在維護去標識化信息共享和分發的安全性，以達到信息去標識化的目的。所述方法包括：獲得待匹配的第一用戶信息密文；從多個用戶信息密文中，確定與所述第一用戶信息密文匹配的第二用戶信息密文；獲取所述第一用戶信息密文對應的第一去標識ID和所述第二用戶信息密文對應的第二去標識ID；建立所述第一去標識ID和所述第二去標識ID的匹配關系。

技術領域

本發明涉及數據處理技術領域，特別是涉及一種信息處理方法、裝置、設備及介質。

背景技術

隨著信息通信技術(例如，大數據相關技術)的發展，一些機構會收集并存儲個人信息，例如，銀行會收集客戶的個人信息并存儲、網絡購物平臺也會收集用戶的個人信息。但是，由于個人信息涉及到用戶的隱私，因此，需要對機構存儲的個人信息進行去標識化處理。其中，去標識化處理是指：通過對個人信息的技術處理，使其在不借助額外信息的情況下，無法識別或者關聯個人信息主體的過程。去標識化建立在個體基礎之上，保留了個體顆粒度，采用假名、加密、哈希函數等技術手段替代對個人信息的標識。

實際中，出于大數據分析的需要，需要對不同機構上存儲的個人信息進行關聯分析，以用于學術研究。例如，將醫療機構存儲的個人病例與銀行機構存儲的客戶信息進行關聯分析，以確定不同財富階層與疾病的關聯、或者不同財富階層在醫療上的支出特點。這樣，便涉及到不同機構之間進行個人信息的共享和分發。

一般而言，在對不同機構的個人信息進行關聯分析時，為了保護隱私，不同機構上傳的都是用戶的去標識信息。例如，醫療機構A將張某某的個人信息去標識化，銀行機構B也將張某某的個人信息去標識化，之后，二者將張某某的去標識信息共享給大數據分析平臺進行學術分析。為了將兩個機構構中張某某的信息相關聯，現有技術一般采用如下方式：

各機構基于同樣的去標識ID進行數據的共享；假設機構A中張某某的ID為A_ID_X，機構B中張某某的ID為B_ID_X，雙方基于同樣的去標識ID為P_ID_X進行數據的融合共享及分析。

上述方式至少存在如下缺點：

雙方基于同樣的去標識ID進行數據的融合共享及分析，雙方可以基于同樣的去標識ID反推對方的數據和對應的個人，或者雙方自行進行數據的共享分發，從而達不到去標識的目的；當多方機構的數據按照這種方式去標識后放到一起進行數據分析時，攻擊者或者惡意攻擊方可以通過針對個體的事件關聯來進行重標識，或者降低去標識化安全程度，從而無法達到去標識的安全要求。

綜上，相關技術中，亟待提高用戶的去標識化信息分享的安全程度，以在多個機構之間進行去標識信息的共享和分發的過程中，降低用戶隱私信息泄露的風險。

發明內容

鑒于上述問題，提出了本發明實施例的一種信息處理方法、裝置、設備及介質，以便克服上述問題或者至少部分地解決上述問題。

為了解決上述問題，本發明的第一方面，公開了一種信息處理方法，所述方法包括：

獲得待匹配的第一用戶信息密文；

從多個用戶信息密文中，確定與所述第一用戶信息密文匹配的第二用戶信息密文；

獲取所述第一用戶信息密文對應的第一去標識ID和所述第二用戶信息密文對應的第二去標識ID；

建立所述第一去標識ID和所述第二去標識ID的匹配關系。

可選地，所述用戶信息密文包括能唯一標識用戶的信息的密文，包括但不限于如下任一個或多個信息：身份ID、姓名、聯系電話。

可選地，所述用戶信息的密文還包括如下任意一個或多個信息的密文：去標識算法、隨機數。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載