[發明專利]分布式集群中的樣本特征分位點確定方法及裝置有效
| 申請號: | 202011233423.X | 申請日: | 2020-11-06 |
| 公開(公告)號: | CN112367396B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 張興盟;余超凡;王磊 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | H04L67/10 | 分類號: | H04L67/10;H04L67/1097;H04L9/40;G06F21/60;G06N3/04;G06N3/08 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 陳霽;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分布式 集群 中的 樣本 特征 分位點 確定 方法 裝置 | ||
1.一種分布式集群中的樣本特征分位點確定方法,用于確定樣本特征中第一屬性項的特征分位點,所述分布式集群包括處于可信執行環境TEE中的主節點和多個從節點;所述方法通過所述主節點的CPU執行,所述主節點還包括內存;所述方法包括:
從所述內存中分別讀取具有設定項數的多個第一數組,所述多個第一數組分別從多個從節點中獲取,且分別基于樣本集中不同的分批樣本的樣本特征得到,所述第一數組中任意一項包括樣本的第一屬性項的特征值與對應的權重值;
按照預定的方式,針對所述多個第一數組進行逐級數組合并,直至最后一級數組合并;其中任意一級數組合并包括:針對包含兩個數組中各項的特征值集合,將其中值大小相同的特征值對應的權重值進行合并,得到合并序列;在所述合并序列中填充若干個偽項以得到填充序列,使得填充序列的項數為該兩個數組的項數之和,任意一個偽項包含預設特征值與對應的預設權重值;基于所述填充序列形成合并數組,并將所述合并數組寫入所述內存;
采用不經意訪問方式,從所述內存中讀取最后一級數組合并得到的合并數組中除若干個偽項之外的項,并基于從該合并數組中讀取的各項確定所述第一屬性項的特征分位點。
2.根據權利要求1所述的方法,其中,所述第一數組為對應的從節點對初始數組進行權重值合并、偽項填充后得到的;所述第一數組包含多個真實項和若干個偽項;所述從所述內存中分別讀取具有設定項數的多個第一數組的步驟,包括:
采用不經意訪問方式,從所述內存中分別讀取多個第一數組中的真實項;
所述針對包含兩個數組中各項的特征值集合,將其中值大小相同的特征值對應的權重值進行合并的步驟,包括:
針對包含兩個數組中各個真實項的特征值集合,將其中值大小相同的特征值對應的權重值進行合并。
3.根據權利要求1所述的方法,所述針對包含兩個數組中各項的特征值集合,將其中值大小相同的特征值對應的權重值進行合并的步驟,包括:
從兩個數組中分別讀取各個項,對各個項進行解密;
針對包含兩個數組中解密后的各項的特征值集合,將其中值大小相同的特征值對應的權重值進行合并。
4.根據權利要求1至3任一項所述的方法,所述將其中值大小相同的特征值對應的權重值進行合并的步驟,包括:
將所述特征值集合中各項的特征值按照值大小進行排序,得到重新排序后的各項組成的初始序列;
針對所述初始序列,將序列中值大小相同的特征值對應的權重值進行合并,得到合并序列。
5.根據權利要求4所述的方法,所述將所述特征值集合中各項的特征值按照值大小進行排序的步驟,包括:
采用不經意排序原語,將所述特征值集合中各項的特征值按照值大小進行排序。
6.根據權利要求4所述的方法,所述將序列中值大小相同的特征值對應的權重值進行合并的步驟,包括:
針對所述初始序列,基于不經意比較原語,比較序列中相鄰特征值是否相同,并將值大小相同的特征值對應的權重值進行合并。
7.根據權利要求1所述的方法,所述基于所述填充序列形成合并數組的步驟,包括:
將所述填充序列形成待剪枝數組,所述待剪枝數組的項數與所述填充序列的項數相同;
基于所述待剪枝數組的項數與預設的最大項數的比較,對所述待剪枝數組進行剪枝操作,得到合并數組。
8.根據權利要求7所述的方法,所述基于所述待剪枝數組的項數與預設的最大項數的比較,對所述待剪枝數組進行剪枝操作的步驟,包括:
當所述待剪枝數組的項數不大于預設的最大項數時,直接將所述待剪枝數組作為所述合并數組;
當所述待剪枝數組的項數大于所述最大項數,且所述待剪枝數組包含的真實項的項數不大于所述最大項數時,減少所述待剪枝數組包含的偽項數量,使得到的合并數組的項數等于所述最大項數;
當所述待剪枝數組的項數大于所述最大項數,且所述待剪枝數組包含的真實項的項數大于所述最大項數時,刪除所述待剪枝數組中的偽項,并將所述待剪枝數組中的真實項剪枝至項數為所述最大項數,得到合并數組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011233423.X/1.html,轉載請聲明來源鉆瓜專利網。





