[發明專利]基于隨機森林算法的降雨—徑流模擬方法在審
| 申請號: | 202010070774.7 | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111291478A | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 趙雪花;張麗娟;王暢;裴源博;祝雪萍;蔡文君 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G06F30/20 | 分類號: | G06F30/20;G06N20/00;G06F111/10 |
| 代理公司: | 太原市科瑞達專利代理有限公司 14101 | 代理人: | 申艷玲 |
| 地址: | 030024 山西*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隨機 森林 算法 降雨 徑流 模擬 方法 | ||
1.基于隨機森林算法的降雨—徑流模擬方法,其特征在于,所述降雨—徑流模擬方法包括以下步驟:
步驟1:獲取場次降雨—徑流觀測數據,分析整理出具有區域代表性的M維降雨特征集合D,所述M維降雨特征包含降雨量、降雨歷時、平均降雨強度、30分鐘降雨強度以及表征流域土壤水分情況的前期影響雨量;
步驟2:利用灰色關聯分析對所述降雨特征進行優勢降雨特征提取,構建由N維優勢降雨特征組成的降雨屬性集合D′,D′∈D,N≤M;
步驟3:以決策樹作為基學習器構建隨機森林模型,進行模型訓練與測試,最終實現徑流模擬過程。
2.根據權利要求1所述的基于隨機森林算法的降雨—徑流模擬方法,其特征在于,所述步驟2具體方法包括:
(1)確立徑流量為母因素序列Y,降雨特征為子因素序列Xi:
Y=Y(k)|k=1,2,…n
Xi=Xi(k)|k=1,2,…n;i=1,2,…m
(2)將原始數據做均值化無量綱處理y(k)、xi(k):
(3)計算關聯系數ξi(k):
(4)計算關聯度ri,并由關聯度構成關聯度矩陣R:
式中,k表示序列長度,i表示子因素個數,△i(k)表示第k個母因素及相應子因素差值的絕對值,ρ表示分辨系數,ρ∈(0,1),可提高關聯系數間的差異顯著性,ρ越小,分辨力越大;
(5)根據關聯度矩陣中各列的關聯度大小判斷優勢降雨特征子因素;對降雨特征進行優勢判斷,剔除非優勢特征,提取關鍵優勢特征構建降雨屬性集合D′,結合區域特征綜合考慮降雨特征對產流的影響。
3.根據權利要求2所述的基于隨機森林算法的降雨—徑流模擬方法,其特征在于,ρ取經驗值0.5。
4.根據權利要求1所述的基于隨機森林算法的降雨—徑流模擬方法,其特征在于,所述步驟3具體方法包括:
(1)劃分訓練數據集T,對T采用隨機且有放回的bootstrap sampling方法進行數據抽樣,抽樣數據構成訓練數據子集T′,且與T具有相同的樣本長度,實現訓練數據集隨機多樣化;
(2)從降雨屬性集合D′中隨機選擇h個屬性作為決策樹的分裂屬性,使用CART(Classification and Regression Tree)算法作為最優屬性劃分依據,從根節點開始逐層向下劃分,在訓練數據子集T′的基礎上自上而下建立基于CART算法的決策樹,每個訓練數據子集T′可對應訓練出一個決策樹基學習器;
(3)重復(1)及(2)步,得到多個訓練數據子集T′及相應的決策樹基學習器,最終得到由多棵決策樹構成的隨機森林模型,完成模型訓練,確定模型適用參數。
(4)將測試數據集C中的降雨屬性集合D′作為隨機森林模型的輸入,經過決策樹基學習器的模擬,輸出多個徑流模擬值,最終模擬結果取各決策樹模擬結果的均值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010070774.7/1.html,轉載請聲明來源鉆瓜專利網。





