[發(fā)明專利]數(shù)據(jù)處理方法和裝置在審
| 申請?zhí)枺?/td> | 201710523102.5 | 申請日: | 2017-06-30 |
| 公開(公告)號: | CN107330464A | 公開(公告)日: | 2017-11-07 |
| 發(fā)明(設計)人: | 沈雄 | 申請(專利權)人: | 眾安信息技術服務有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/30 |
| 代理公司: | 北京永新同創(chuàng)知識產權代理有限公司11376 | 代理人: | 鐘勝光 |
| 地址: | 518052 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù)處理 方法 裝置 | ||
1.一種數(shù)據(jù)處理方法,其特征在于,包括:
獲取預定時間段內的增量數(shù)據(jù),并基于是否存在分類模型來確定生成決策樹的數(shù)量;
若存在分類模型,則根據(jù)所述增量數(shù)據(jù)生成增量決策樹,并基于所述增量決策樹和所述分類模型中的模型決策樹來對所述增量數(shù)據(jù)進行標簽預測,其中,所述增量決策樹的數(shù)量基于所述原始決策樹的數(shù)量來確定;
確定所述分類模型中的模型決策樹和所述增量決策樹中的各個決策樹的綜合性能;
基于所述各個決策樹的綜合性能,從所述分類模型中的模型決策樹和所述增量決策樹中選取預定數(shù)量的決策樹來作為更新后的所述分類模型中的模型決策樹。
2.如權利要求1所述的數(shù)據(jù)處理方法,其特征在于,所述各個決策樹的綜合性能至少基于所述各個決策樹的建立時間以及針對所述增量數(shù)據(jù)的預測準確率來確定。
3.如權利要求2所述的數(shù)據(jù)處理方法,其特征在于,還包括對所述各個決策樹的綜合性能進行排序的步驟,該排序的步驟包括:
根據(jù)所述標簽預測的結果來確定所述各個決策樹針對所述增量數(shù)據(jù)的預測準確率;
將所述各個決策樹的建立時間作為確定所述綜合性能的權重,并對所述增量數(shù)據(jù)的預測準確率進行排序;
其中,建立時間長的決策樹的權重小于建立時間短的決策樹的權重。
4.如權利要求1所述的數(shù)據(jù)處理方法,其特征在于,根據(jù)所述增量數(shù)據(jù)生成所述增量決策樹包括:
對所述增量數(shù)據(jù)有放回地抽取多個樣本集,并基于所述多個樣本集生成多個所述增量決策樹。
5.如權利要求1所述的數(shù)據(jù)處理方法,其特征在于,所述增量決策樹的數(shù)量的范圍是所述分類模型中的模型決策樹的數(shù)量的10%至30%。
6.如權利要求1所述的數(shù)據(jù)處理方法,其特征在于,所選取的預定數(shù)量的決策樹的數(shù)量等于所述分類模型中的原有的模型決策樹的數(shù)量。
7.如權利要求1所述的數(shù)據(jù)處理方法,其特征在于,若不存在所述分類模型,則根據(jù)歷史數(shù)據(jù)創(chuàng)建包括模型決策樹的分類模型,其中,所述歷史數(shù)據(jù)是已分類的數(shù)據(jù)。
8.一種有形的計算機可讀存儲介質,該介質包括指令,當該指令被執(zhí)行時,引起計算設備至少用于:
獲取預定時間段內的增量數(shù)據(jù),并基于是否存在分類模型來確定生成決策樹的數(shù)量;
若存在分類模型,則根據(jù)所述增量數(shù)據(jù)生成增量決策樹,并基于所述增量決策樹和所述分類模型中的模型決策樹來對所述增量數(shù)據(jù)進行標簽預測,其中,所述增量決策樹的數(shù)量基于所述原始決策樹的數(shù)量來確定;
確定所述分類模型中的模型決策樹和所述增量決策樹中的各個決策樹的綜合性能;
基于所述各個決策樹的綜合性能,從所述分類模型中的模型決策樹和所述增量決策樹中選取預定數(shù)量的決策樹來作為更新后的所述分類模型中的模型決策樹。
9.如權利要求8所述的計算機可讀存儲介質,其特征在于,該指令引起所述計算設備至少基于所述各個決策樹的建立時間以及針對所述增量數(shù)據(jù)的預測準確率來確定所述各個決策樹的綜合性能。
10.如權利要求9所述的計算機可讀存儲介質,其特征在于,確定所述各個決策樹的綜合性能的步驟包括:
根據(jù)所述標簽預測的結果來確定所述各個決策樹針對所述增量數(shù)據(jù)的預測準確率;
將所述各個決策樹的建立時間作為確定所述綜合性能的權重,并對所述增量數(shù)據(jù)的預測準確率進行排序;
其中,建立時間長的決策樹的權重小于建立時間短的決策樹的權重。
11.如權利要求8所述的計算機可讀存儲介質,其特征在于,根據(jù)所述增量數(shù)據(jù)生成所述增量決策樹包括:
對所述增量數(shù)據(jù)有放回地抽取多個樣本集,進而基于所述多個樣本集來生成多個所述增量決策樹。
12.如權利要求8所述的計算機可讀存儲介質,其特征在于,所述增量決策樹的數(shù)量的范圍是所述分類模型中的模型決策樹的數(shù)量的10%至30%。
13.如權利要求8所述的計算機可讀存儲介質,其特征在于,所選取的預定數(shù)量的決策樹的數(shù)量等于所述分類模型中的原有的模型決策樹的數(shù)量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于眾安信息技術服務有限公司,未經眾安信息技術服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710523102.5/1.html,轉載請聲明來源鉆瓜專利網。
- 數(shù)據(jù)處理設備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





