[發明專利]利用復合機器學習模型來執行預測的方法及系統在審
| 申請號: | 202110773264.0 | 申請日: | 2017-05-05 |
| 公開(公告)號: | CN113570064A | 公開(公告)日: | 2021-10-29 |
| 發明(設計)人: | 楊強;戴文淵;陳雨強;郭夏瑋;涂威威 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N5/02;G06Q10/04 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 王艷茹;蘇銀虹 |
| 地址: | 100085 北京市海淀區清*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 復合 機器 學習 模型 執行 預測 方法 系統 | ||
1.一種利用復合機器學習模型來執行預測的方法,其中,所述復合機器學習模型包括至少兩種類型的子模型,所述方法包括:
(A)獲取預測數據記錄;
(B)基于預測數據記錄的屬性信息來生成與預測數據記錄對應的預測樣本的多個特征子集;以及
(C)將預測樣本的多個特征子集分別提供給復合機器學習模型所包括的子模型,以得到復合機器學習模型針對預測樣本的預測結果,
其中,在所述復合機器學習模型中,所述子模型根據梯度提升框架訓練而成。
2.如權利要求1所述的方法,其中,所述子模型包括至少一個線性子模型和至少一個決策樹子模型。
3.如權利要求1所述的方法,其中,所述子模型包括至少一個上下層嵌套的復合子模型。
4.如權利要求3所述的方法,其中,所述復合子模型的上層模型為一個決策樹模型部分,并且,所述復合子模型的下層模型為至少一個線性模型部分,其中,每個線性模型部分對應于決策樹模型部分的一個葉子節點。
5.如權利要求2所述的方法,其中,在步驟(B)中,基于預測數據記錄的屬性信息來生成預測樣本的特征,并根據特征的取值連續性和/或取值空間規模來生成預測樣本的決策樹特征子集和預測樣本的線性特征子集。
6.如權利要求2所述的方法,其中,在步驟(B)中,基于預測數據記錄的屬性信息來生成預測樣本的特征,并根據特征的缺失性來生成預測樣本的決策樹特征子集和預測樣本的線性特征子集,其中,特征的缺失性指示該特征是否基于預測數據記錄相對于訓練數據記錄的缺失屬性信息而生成。
7.如權利要求4所述的方法,其中,在步驟(B)中,基于預測數據記錄的屬性信息來生成預測樣本的特征,并根據特征的取值連續性和/或取值空間規模來生成預測樣本的上層特征子集和預測樣本的下層特征子集。
8.一種利用復合機器學習模型來執行預測的系統,其中,所述復合機器學習模型包括至少兩種類型的子模型,所述系統包括:
預測數據記錄獲取裝置,用于獲取預測數據記錄;
預測特征子集產生裝置,用于基于預測數據記錄的屬性信息來生成與預測數據記錄對應的預測樣本的多個特征子集;以及
預測裝置,用于將預測樣本的多個特征子集分別提供給復合機器學習模型所包括的子模型,以得到復合機器學習模型針對預測樣本的預測結果,
其中,在所述復合機器學習模型中,所述子模型根據梯度提升框架訓練而成。
9.一種訓練復合機器學習模型的方法,其中,所述復合機器學習模型包括至少兩種類型的子模型,所述方法包括:
(a)獲取訓練數據記錄;
(b)基于訓練數據記錄的屬性信息來生成與訓練數據記錄對應的訓練樣本的多個特征子集;以及
(c)根據梯度提升框架來訓練復合機器學習模型所包括的子模型,其中,每個子模型基于各自的特征子集來進行訓練。
10.一種訓練復合機器學習模型的系統,其中,所述復合機器學習模型包括至少兩種類型的子模型,所述系統包括:
訓練數據記錄獲取裝置,用于獲取訓練數據記錄;
訓練特征子集產生裝置,用于基于訓練數據記錄的屬性信息來生成與訓練數據記錄對應的訓練樣本的多個特征子集;以及
訓練裝置,用于根據梯度提升框架來訓練復合機器學習模型所包括的子模型,其中,每個子模型基于各自的特征子集來進行訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110773264.0/1.html,轉載請聲明來源鉆瓜專利網。





