[發明專利]基于數據隱私保護的公共數據集確定方法、裝置及系統有效
| 申請號: | 202010759417.1 | 申請日: | 2020-07-31 |
| 公開(公告)號: | CN111741020B | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 李漓春;趙原;孫勇 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F21/60;G06F21/62 |
| 代理公司: | 北京永新同創知識產權代理有限公司 11376 | 代理人: | 林錦輝;劉景峰 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 數據 隱私 保護 公共 確定 方法 裝置 系統 | ||
本說明書的實施例提供用于確定兩個數據擁有方的公共數據集的方法和裝置。各個數據擁有方分別使用各自的密鑰加密各自的數據集,并將各自的數據集加密結果發送給對端數據擁有方。第二數據擁有方使用所具有的密鑰對從第一數據擁有方接收的數據集加密結果二次加密,亂序二次加密結果,并將亂序后的二次加密結果發送給第一數據擁有方。第一數據擁有方使用所具有的密鑰對亂序后的二次加密結果解密,并根據解密結果和從第二數據擁有方接收的數據集加密結果確定交集信息。第二數據擁有方根據交集信息確定第一和第二數據擁有方的公共數據集的明文數據。
技術領域
本說明書實施例通常涉及人工智能領域,尤其涉及基于數據隱私保護的公共數據集確定方法、裝置及系統。
背景技術
隨著人工智能技術的發展,例如機器學習模型的業務模型已經逐漸應用于各種業務應用場景,比如,風險評估、語音識別、自然語言處理等。為了得到更好的業務服務效果,在進行業務處理時,需要使用多個數據擁有方的本地業務數據來聯合處理。在一些情況下,需要確定出數據擁有方之間的公共數據集,并且使用所確定出的公共數據集來進行后續業務處理。例如,在兩個業務方進行聯合營銷的情況下,兩個業務方需要確定出共同的客戶數據,然后使用所確定的共同客戶數據來進行聯合營銷。然而,除了公共數據集之外,各個數據擁有方的剩余業務數據屬于各個數據擁有方的隱私數據,不能泄露給其它數據擁有方。如何在確保各個數據擁有方的隱私數據安全的情況下確定公共數據集成為亟待解決的問題。
發明內容
鑒于上述,本說明書實施例提供用于確定第一和第二數據擁有方的公共數據集的方法、裝置及系統。利用該方法、裝置及系統,在兩個數據擁有方處分別使用各自的密鑰對各自的數據集進行加密,并且在兩個數據擁有方之間共享經過加密后的數據集。在第二數據擁有方處,使用所具有的密鑰對從第一數據擁有方接收的加密數據集進行二次加密,并對二次加密結果進行亂序處理,然后將亂序處理結果返回給第一數據擁有方。第一數據擁有方使用所具有的密鑰對亂序處理結果解密,確定出解密結果和從第二數據擁有方接收的加密數據集之間的交集信息并返回給第二數據擁有方。第二數據擁有方利用該交集信息確定出公共數據集的明文數據。按照上述公共數據集確定方案,在兩個數據擁有方之間交互的都是經過加密處理后的密文信息,由此可以防止各個數據擁有方所具有的隱私數據外泄。
根據本說明書實施例的一個方面,提供一種用于確定第一和第二數據擁有方的公共數據集的方法,第一數據擁有方具有第一數據集和第一密鑰,第二數據擁有方具有第二數據集和第二密鑰,所述方法包括:在第一和第二數據擁有方處,分別使用第一密鑰和第二密鑰對第一數據集和第二數據集加密得到第一加密數據序列和第二加密數據序列;第一數據擁有方將第一加密數據序列發送給第二數據擁有方,以及第二數據擁有方將第二加密結果發送給第一數據擁有方,第二加密結果包括第二加密數據序列或第二加密數據序列的變型;在第二數據擁有方處,使用第二密鑰對第一加密數據序列加密,亂序所得到的加密結果,并將亂序后的加密結果發送給第一數據擁有方;在第一數據擁有方處,使用第一密鑰對所述亂序后的加密結果解密得到第三加密數據序列,根據第三加密數據序列和第二加密結果確定第三加密數據序列和第二加密數據序列的交集信息,并將所述交集信息發送給第二數據擁有方;以及在第二數據擁有方處,根據所述交集信息確定第一和第二數據擁有方的公共數據集的明文數據。
可選地,在上述方面的一個示例中,第一數據集是小集合數據集,以及第二數據集是大集合數據集。
可選地,在上述方面的一個示例中,第二加密數據序列的變型包括:第二加密數據序列中的各個密文數據元素的第一哈希值集合或者利用第二加密數據序列中的各個密文數據元素構建的第一布隆過濾器。
可選地,在上述方面的一個示例中,所述交集信息包括:第三加密數據序列和第二加密數據序列的交集密文信息;第三加密數據序列和第二加密數據序列的交集元素的第二哈希值集合,所述交集元素通過使用第三加密數據序列的元素哈希值來在第一哈希值集合中查詢出;或者利用第三加密數據序列和第二加密數據序列的交集元素構建的第二布隆過濾器,所述交集元素利用第一布隆過濾器從第三加密數據序列中匹配出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010759417.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種污泥重金屬處理裝置和方法
- 下一篇:一種無火香薰原料提取裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





