[發明專利]基于lasso及隨機森林的高拱壩谷幅變形分析方法有效
| 申請號: | 202010068541.3 | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111275341B | 公開(公告)日: | 2022-03-29 |
| 發明(設計)人: | 徐衛亞;史宏娟;孟慶祥;楊蘭蘭;閆龍 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06K9/62;G06F30/20 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210024 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 lasso 隨機 森林 拱壩 變形 分析 方法 | ||
1.一種基于lasso及隨機森林的高拱壩谷幅變形分析方法,其特征在于,包括以下步驟:
(1)獲取壩區現場的相關監測數據,建立數據分析體系,所述數據分析體系以谷幅影響因素值為自變量,以谷幅變形值為因變量;
(2)對所述監測數據進行預處理,剔除其中的異常值和缺失值;
(3)對預處理后的監測數據中的影響因素進行二次處理,確定影響因素的潛在影響方式,據此構建影響因素的相關影響因子,并確定高維影響因子組;
(4)根據所述高維影響因子組中的影響因子建立lasso分析模型并進行特征篩選,確定出一個或多個重要影響因子:
將所述高維影響因子組中的影響因子作為模型因子,建立lasso分析模型;對模型因子進行標準化處理,得到標準化影響因子,消除量綱的影響;通過最速下降算法進行特征篩選:將所述標準化影響因子帶入模型計算,獲得影響因子系數稀疏矩陣,并結合交叉驗證法,多次計算,以模型方差為度量標準,選出誤差最小的模型對應的模型系數,確定最優稀疏矩陣;
通過對多條測線變形全時段及具有明顯相同變形特征的變形時段分別進行計算,根據計算結果,結合稀疏矩陣中影響因子出現的頻次確定重要影響因子;
(5)將所述重要影響因子作為對應影響因素的代表影響因子,構建影響因素數據體系,用隨機森林算法進行分析,劃分訓練集及預測集,以預測準確率作為檢驗標準,通過基尼系數對谷幅變形影響因素的重要程度進行排序;
(6)根據影響因素的重要程度排序來綜合評價各影響因素對谷幅變形的影響。
2.根據權利要求1所述的方法,其特征在于,步驟(1)中,所述相關監測數據包括庫水位升降速率、庫水位高程、各測線谷幅變形累計值、壩區氣溫及壩區降雨量;其中,庫水位升降速率、庫水位高程、各測線谷幅變形累計值同步監測,壩區氣溫及降雨量數據選用國家氣象數據中心氣象數據集,以空間插值理論為基礎,按監測點位置信息批量提取以獲得降雨量及氣溫數據。
3.根據權利要求2所述的方法,其特征在于,所述數據分析體系的自變量包括庫水位升降速率、庫水位高程、壩區氣溫及降雨量,所述因變量為各測線谷幅變形累計值。
4.根據權利要求3所述的方法,其特征在于,步驟(3)包括:根據預處理后的降雨量和氣溫數據,統計前n天累計降雨量、前n天降雨量最大差值、前n天累計氣溫值、前n天氣溫值最大差值,確定l*m的高位影響因子組;其中n為統計的天數,l為潛在影響因子總數,m為影響因子數據集的數據組數。
5.根據權利要求1所述的方法,其特征在于,步驟(5)包括:
將重要影響因子作為對應影響因素的代表影響因子,結合庫水位高程、庫水位變化速率構建影響因素數據體系;
用隨機森林算法進行分析,并將谷幅變形量按單位時間變形量大小將變形情況分類,進行劃分訓練集及預測集,將代表影響因子作為自變量,單位時間谷幅變形量類別作為分類變量,選取模型參數,計算模型預測準確率;
利用交叉驗證法根據預測準確率選取最優模型,并計算最優模型下各影響因素的基尼系數,對谷幅變形影響因素的重要程度進行排序。
6.根據權利要求1所述的方法,其特征在于,步驟(2)中的異常值包括離群點及高杠桿點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010068541.3/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





