[發明專利]基于機器學習的預測分類方法、裝置和計算機設備在審
| 申請號: | 202010281340.1 | 申請日: | 2020-04-10 |
| 公開(公告)號: | CN111522862A | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 唐永鵬;劉碩凌;程寧;韓雷 | 申請(專利權)人: | 易方達基金管理有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06Q40/04;G06N20/00 |
| 代理公司: | 北京英特普羅知識產權代理有限公司 11015 | 代理人: | 程超 |
| 地址: | 519000 廣東省珠海市橫琴新*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 機器 學習 預測 分類 方法 裝置 計算機 設備 | ||
1.一種基于機器學習的預測分類方法,其特征在于,包括:
獲取經濟數據集,其中,所述經濟數據集包括在時間上延續N條經濟數據,每條所述經濟數據包括M個經濟特征,其中,N和M均為自然數;
確定每條所述經濟數據對應的分類結果,其中,所述分類結果包括第一結果和第二結果;
根據所述經濟數據集和每條所述經濟數據對應的分類結果構建P個第一數據集,其中,所述第一數據集包括若干條所述經濟數據和對應的所述分類結果,且所述第一數據集中的所述經濟數據在時間上不延續,P為自然數;
根據所述經濟數據構建輸入特征,將所述經濟數據對應的分類結果作為輸出,針對每個所述第一數據集構建初始機器學習模型,并進行W折交叉驗證,得到W*P個訓練好的機器學習模型;
在所述W*P個訓練好的機器學習模型中按照預設要求選擇若干最終模型;
根據待預測經濟數據構建待預測輸入特征,并將所述待預測輸入特征輸入至所述最終模型,以得到預測分類結果。
2.根據權利要求1所述的基于機器學習的預測分類方法,其特征在于,采用以下方法構建P個第一數據集:
以P為間隔將所述經濟數據集進行分割,得到Q個數據集單元,其中,P*Q小于或等于N;
將各個所述數據集單元中相同位置的所述經濟數據及其對應的所述分類結果劃分為同一數據集,以得到所述第一數據集。
3.根據權利要求2所述的基于機器學習的預測分類方法,其特征在于,根據所述經濟數據構建輸入特征的步驟包括:
獲取所述第一數據集中的第一經濟數據,其中,所述第一經濟數據為所述第一數據集中的任意一條所述經濟數據,所述第一經濟數據包括第1至第n經濟特征;
確定時間區間集合{t1,t2,...tm};
在所述經濟數據集中獲取第x經濟特征之前且與所述第x經濟特征屬于同類的ty個經濟特征的平均值,作為所述第x經濟特征對應的第y維特征,其中,x=1,2,...,n,y=1,2,...,m;
將所述第一經濟數據中的每個經濟特征對應的m維特征作為所述輸入特征。
4.根據權利要求3所述的基于機器學習的預測分類方法,其特征在于,在所述W*P個訓練好的機器學習模型中按照預設要求選擇若干最終模型的步驟包括:
獲取所述W*P個訓練好的機器學習模型中AUC大于60%的機器學習模型作為所述最終模型。
5.根據權利要求4所述的基于機器學習的預測分類方法,其特征在于,
所述經濟數據包括以下至少一種經濟特征:股票成交價格、成交量、估值和指數市值;
所述第一結果為股市第一風格,所述第二結果為股市第二風格;
P=22,m=10。
6.一種基于機器學習的預測分類裝置,其特征在于,包括:
獲取模塊,用于獲取經濟數據集,其中,所述經濟數據集包括在時間上延續N條經濟數據,每條所述經濟數據包括M個經濟特征,其中,N和M均為自然數;
確定模塊,用于確定每條所述經濟數據對應的分類結果,其中,所述分類結果包括第一結果和第二結果;
構建模塊,用于根據所述經濟數據集和每條所述經濟數據對應的分類結果構建P個第一數據集,其中,所述第一數據集包括若干條所述經濟數據和對應的所述分類結果,且所述第一數據集中的所述經濟數據在時間上不延續,P為自然數;
訓練模塊,用于根據所述經濟數據構建輸入特征,將所述經濟數據對應的分類結果作為輸出,針對每個所述第一數據集構建初始機器學習模型,并進行W折交叉驗證,得到W*P個訓練好的機器學習模型;
選取模塊,用于在所述W*P個訓練好的機器學習模型中按照預設要求選擇若干最終模型;
預測模塊,用于根據待預測經濟數據構建待預測輸入特征,并將所述待預測輸入特征輸入至所述最終模型,以得到預測分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于易方達基金管理有限公司,未經易方達基金管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010281340.1/1.html,轉載請聲明來源鉆瓜專利網。





