[發明專利]一種基于隨機森林機器學習算法的未取樣點巖土參數評估方法在審
| 申請號: | 202011153295.8 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112329939A | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 裴堯堯;鄭志剛;李麗華;肖衡林;馬強;陶高梁;劉永莉;李文濤;周鑫隆;鐘楚珩 | 申請(專利權)人: | 湖北工業大學 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 楊宏偉 |
| 地址: | 430068 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 隨機 森林 機器 學習 算法 取樣 巖土 參數 評估 方法 | ||
1.一種基于隨機森林機器學習算法的未取樣點巖土參數評估方法,其特征在于,包括如下步驟:
(1)建立樣本集
對原始測試樣本點數據進行預處理,提取樣本特征與樣本標簽,形成樣本集,樣本特征為土體的三維坐標(X,Y,Z),樣本標簽為待測土體的巖土參數,記為(S1,S2…Sn),Sn為第n個巖土參數,n為大于或等于1的正整數;
(2)模型訓練
將樣本集劃分為訓練集和測試集,利用訓練集樣本代入隨機森林算法中進行機器學習訓練,由訓練集的樣本特征(Xtrain,Ytrain,Ztrain)和樣本標簽(S1train,S2train…Sntrain)初步形成隨機森林模型;
(3)測試模型
將測試集的樣本特征(Xtest,Ytest,Ztest)代入上步驟形成的隨機森林模型中,求得預測標簽(S1spredict,S2spredict…Snspredict),與實際測試集的樣本標簽(S1test,S2test…Sntest)進行對比,針對預測效果進行評分反饋,調整隨機森林模型的參數直到訓練出預期精度分數;
(4)未取樣點預測
將未取樣點特征即三維坐標參數(Xpredict,Ypredict,Zpredict)代入到已測試過的隨機森林模型中,得到預測標簽,即為相應的巖土參數。
2.如權利要求1所述基于隨機森林機器學習算法的未取樣點巖土參數評估方法,其特征在于:步驟(4)中,獲取巖土參數采用圖形處理工具進行可視化處理,圖形工具包括Matplotlib、Mayavi和Paraview,其中Matplotlib用于二維可視化,Mayavi和Paraview用來三維的可視化。
3.如權利要求1所述基于隨機森林機器學習算法的未取樣點巖土參數評估方法,其特征在于:步驟(2)中,采用隨機抽取方式將樣本集劃分為訓練集和測試集,其中訓練集占65-80%,測試集占20-35%。
4.如權利要求1所述基于隨機森林機器學習算法的未取樣點巖土參數評估方法,其特征在于:步驟(2)和步驟(3)中,將樣本集采用隨機的方式多次劃分為訓練集和測試集,重復測試并取平均值的方法進行精度計算。
5.如權利要求1所述基于隨機森林機器學習算法的未取樣點巖土參數評估方法,其特征在于:步驟(2)中,通過選擇構建決策樹模型的數據和特征兩種方式對隨機森林中的每棵決策樹進行隨機化,以確保隨機森林算法中的每個子決策樹模型都不同。
6.如權利要求1所述基于隨機森林機器學習算法的未取樣點巖土參數評估方法,其特征在于:步驟(2)中,通過n_estimators參數來調整隨機森林模型中決策樹的數量,n_estimators參數默認值取100。
7.如權利要求1所述基于隨機森林機器學習算法的未取樣點巖土參數評估方法,其特征在于:步驟(2)中,通過控制子決策樹模型深度、最大特征、最小特征和分裂次數的sklearn參數來調節隨機森林模型的性能。
8.如權利要求1所述基于隨機森林機器學習算法的未取樣點巖土參數評估方法,其特征在于:步驟(1)中,對于采集的原始測試樣本點數據缺失的采用均值插補補全。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業大學,未經湖北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011153295.8/1.html,轉載請聲明來源鉆瓜專利網。





