[發明專利]針對多方的隱私數據進行聚類的方法和裝置有效
| 申請號: | 202010631310.9 | 申請日: | 2020-07-03 |
| 公開(公告)號: | CN111523143B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 陳超超;周俊;王力;鄭龍飛 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06K9/62 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 孫欣欣;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 多方 隱私 數據 進行 方法 裝置 | ||
本說明書實施例提供一種針對多方的隱私數據進行聚類的方法和裝置,方法包括:第一方確定K個類簇當前分別對應的各中心數據的第一數據部分,第一數據部分對應于第一維度集合;第二方具有各中心數據的對應于第二維度集合的第二數據部分;分別將各中心數據作為目標中心數據,基于N個樣本中任一樣本的第一特征部分和目標中心數據的第一數據部分,通過本地計算得到任一樣本和目標中心數據的目標距離的第一分片;基于各目標距離的第一分片,利用秘密共享的方式,與第二方中的各目標距離的第二分片進行聯合比較,確定各目標距離中的最近的目標距離;將最近的目標距離對應的類簇,確定為任一樣本當前歸屬的類簇。能夠防止泄露隱私數據。
技術領域
本說明書一個或多個實施例涉及計算機領域,尤其涉及針對多方的隱私數據進行聚類的方法和裝置。
背景技術
聚類是機器學習中一種很常用的技術。它常常被應用于社區發現、異常檢測等任務。通常的聚類算法,是一種無監督學習算法,目的是將相似的對象歸到同一個類蔟中。類蔟內的對象越相似,聚類的效果就越好。聚類和分類最大的不同在于,分類的目標事先已知,而聚類則不一樣。其產生的結果和分類相同,而只是類別沒有預先定義。
在某些場景下,數據垂直分布在多方。各方具有的數據可能為隱私數據,也就是說,一方具有的隱私數據不能公開給其他方。這種情況下,現有技術未提供合適的聚類方法。
因此,希望能有改進的方案,在針對多方的隱私數據進行聚類時,能夠防止泄露隱私數據。
發明內容
本說明書一個或多個實施例描述了一種針對多方的隱私數據進行聚類的方法和裝置,在針對多方的隱私數據進行聚類時,能夠防止泄露隱私數據。
第一方面,提供了一種針對多方的隱私數據進行聚類的方法,所述多方包括第一方和第二方,所述第一方的隱私數據包括N個樣本的第一特征部分,所述第一特征部分對應于第一維度集合,所述第二方的隱私數據包括所述N個樣本的第二特征部分,所述第二特征部分對應于第二維度集合,所述方法通過所述第一方執行,包括多輪迭代過程,其中任意一輪迭代包括:
確定K個類簇當前分別對應的各中心數據的第一數據部分,所述第一數據部分對應于所述第一維度集合;所述第二方具有所述各中心數據的對應于所述第二維度集合的第二數據部分;任一中心數據的第一數據部分和該中心數據的第二數據部分共同構成該中心數據;
分別將所述各中心數據作為目標中心數據,基于所述N個樣本中任一樣本的第一特征部分和目標中心數據的第一數據部分,通過本地計算得到所述任一樣本和所述目標中心數據的目標距離的第一分片;所述第二方具有所述目標距離的第二分片;
基于各目標距離的第一分片,利用秘密共享的方式,與第二方中的各目標距離的第二分片進行聯合比較,確定各目標距離中的最近的目標距離;
將所述最近的目標距離對應的類簇,確定為所述任一樣本當前歸屬的類簇。
在一種可能的實施方式中,所述本地計算包括:
將所述任一樣本的第一特征部分作為第一子向量,將目標中心數據的第一數據部分作為第二子向量,計算所述第一子向量和所述第二子向量之間的向量距離,將所述向量距離確定為所述任一樣本和所述目標中心數據的目標距離的第一分片。
在一種可能的實施方式中,所述任意一輪迭代為第一輪迭代,所述K個類簇當前分別對應的各中心數據的第一數據部分為隨機初始化的數據。
在一種可能的實施方式中,所述聯合比較包括:
基于所述各目標距離中任意兩個目標距離的第一分片,利用秘密共享的方式,與所述第二方中的該任意兩個目標距離的第二分片進行聯合比較,確定該任意兩個目標距離之間的距離遠近的比較結果;
根據各比較結果,確定所述各目標距離中的最近的目標距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010631310.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種企業保險的實現方法和裝置
- 下一篇:一種信息驗證方法、裝置及設備
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





