[發明專利]一種訓練樹模型的方法、裝置和用于訓練樹模型的裝置在審
| 申請號: | 202010764640.5 | 申請日: | 2020-07-30 |
| 公開(公告)號: | CN112052875A | 公開(公告)日: | 2020-12-08 |
| 發明(設計)人: | 王國賽;何旭;范曉昱;陳琨 | 申請(專利權)人: | 華控清交信息科技(北京)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F21/60;G06F17/16 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 訓練 模型 方法 裝置 用于 | ||
本發明實施例提供一種訓練樹模型的方法、裝置和用于訓練樹模型的裝置,用于基于數據集訓練樹模型,數據集中包括m條樣本數據和m個樣本標簽,每條樣本數據包括n個特征,數據集中的特征和特征值為密文。該方法包括:依據數據集,基于密文生成候選分組;依據每個候選分組,基于密文將數據集劃分為左子集和右子集;基于每個候選分組劃分得到的左子集和右子集,計算每個候選分組的劃分系數;確定目標候選分組中的特征為最優特征,以及確定目標候選分組中的閾值為最優切分點,最優特征和最優切分點為密文;依據最優特征和最優切分點,將數據集分配到當前節點的兩個子節點。本發明實施例可以基于數據的密文訓練樹模型,保護數據的隱私安全。
技術領域
本發明涉及計算機技術領域,尤其涉及一種訓練樹模型的方法、裝置和用于訓練樹模型的裝置。
背景技術
決策樹是一種樹形結構,樹中的每個內部節點表示一個屬性上的判斷,每個分支代表一個判斷結果的輸出,每個葉節點代表一種分類結果。通過樣本數據可以訓練決策樹。利用訓練的決策樹,可以對新的數據給出正確的分類結果。
隨著大數據時代的來臨,大數據平臺下匯集了用戶在使用網絡服務過程中所產生的業務數據,其中不可避免地有關系到用戶身份保密、賬戶安全和個人隱私的敏感信息,這些信息一旦泄露會給用戶生活帶來嚴重的危害。
因此,如何在訓練決策樹的過程中保護數據的隱私安全,成為目前亟待解決的問題。
發明內容
本發明實施例提供一種訓練樹模型的方法、裝置和用于訓練樹模型的裝置,可以基于數據的密文訓練樹模型,保護數據的隱私安全。
為了解決上述問題,本發明實施例公開了一種訓練樹模型的方法,所述方法用于基于數據集訓練樹模型,所述數據集中包括m條樣本數據和m個樣本標簽,每條樣本數據包括n個特征,所述數據集中的特征和特征值為密文,所述方法包括:
依據所述數據集,基于密文生成候選分組,每個候選分組由一個特征和該特征對應的閾值組成;
依據所述每個候選分組,基于密文將所述數據集劃分為左子集和右子集;
基于所述每個候選分組劃分得到的左子集和右子集,計算所述每個候選分組的劃分系數;
確定目標候選分組中的特征為最優特征,以及確定所述目標候選分組中的閾值為最優切分點,所述目標候選分組為劃分系數滿足預設條件的候選分組,所述最優特征和所述最優切分點為密文;
依據所述最優特征和所述最優切分點,將所述數據集分配到當前節點的兩個子節點;
對所述兩個子節點遞歸執行上述步驟,直至滿足停止條件。
另一方面,本發明實施例公開了一種訓練樹模型的裝置,所述裝置用于基于數據集訓練樹模型,所述數據集中包括m條樣本數據和m個樣本標簽,每條樣本數據包括n個特征,所述數據集中的特征和特征值為密文,所述裝置包括:
分組生成模塊,用于依據所述數據集,基于密文生成候選分組,每個候選分組由一個特征和該特征對應的閾值組成;
子集劃分模塊,用于依據所述每個候選分組,基于密文將所述數據集劃分為左子集和右子集;
系數計算模塊,用于基于所述每個候選分組劃分得到的左子集和右子集,計算所述每個候選分組的劃分系數;
最優確定模塊,用于確定目標候選分組中的特征為最優特征,以及確定所述目標候選分組中的閾值為最優切分點,所述目標候選分組為劃分系數滿足預設條件的候選分組,所述最優特征和所述最優切分點為密文;
數據分配模塊,用于依據所述最優特征和所述最優切分點,將所述數據集分配到當前節點的兩個子節點;
遞歸執行模塊,用于對所述兩個子節點遞歸執行上述步驟,直至滿足停止條件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華控清交信息科技(北京)有限公司,未經華控清交信息科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010764640.5/2.html,轉載請聲明來源鉆瓜專利網。





