[發明專利]一種基于XGBoost模型的森林火災風險預測算法在審
| 申請號: | 202310566771.6 | 申請日: | 2023-05-18 |
| 公開(公告)號: | CN116611012A | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 李杰;馮建元;宋振林;龐立新 | 申請(專利權)人: | 亞太衛星寬帶通信(深圳)有限公司 |
| 主分類號: | G06F18/243 | 分類號: | G06F18/243;G06F18/213;G06Q50/26;G06Q10/04;G06F18/214 |
| 代理公司: | 深圳市深可信專利代理有限公司 44599 | 代理人: | 劉昌剛 |
| 地址: | 518000 廣東省深圳市寶安區航城街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 xgboost 模型 森林 火災 風險 預測 算法 | ||
1.一種基于XGBoost模型的森林火災風險預測算法,其特征在于,該算法包括算法模型建立的步驟和基于XGBoost的核心算法步驟;
所述算法模型建立的步驟包括:
S101、XGBoost在目標函數中顯示的加上了正則化項;
S102、使用Loss?Function對f(x)的一階導數計算出偽殘差用于學習生成fm(x);
所述基于XGBoost的核心算法步驟包括:
S201、不斷地向XGBoost中添加決策樹;
S202、當訓練完成得到k棵決策樹,預測一個樣本的分數;
S203、將每棵決策樹對應的分數相加得到該樣本的預測值,其公式表示為:
其中,f(x)采用泰勒展開近似。
2.根據權利要求1所述的一種基于XGBoost模型的森林火災風險預測算法,其特征在于,步驟S101中,基學習為CART時,正則化項與樹的葉子節點的數量T和葉子節點的值有關,損失函數定義為:
其中,n為訓練函數樣本數,l是對單個樣本的損失;當該損失函數為凸函數,,為模型對訓練樣本的預測值,yi為訓練樣本的真實標簽值;
正則化項Ω(fk)定義了算法模型的復雜程度,這里正則化項的表達式為:
其中,γ和λ為人工設置的參數,w為決策樹所有葉子節點值形成的向量,T為葉子節點數。
3.根據權利要求2所述的一種基于XGBoost模型的森林火災風險預測算法,其特征在于,步驟S102中,XGBoost不僅使用到了一階導數,還使用二階導數;
第t次的loss:
對上式做二階泰勒展開:
其中,g為一階導數,h為二階導數。
4.根據權利要求3所述的一種基于XGBoost模型的森林火災風險預測算法,其特征在于,所述步驟S102之后還包括步驟S103:
XGBoost尋找分割點的標準是最大化,γ和λ均與正則化項相關:
5.根據權利要求4所述的一種基于XGBoost模型的森林火災風險預測算法,其特征在于,在算法模型建立的步驟中,XGBoost在實現時需要進行優化,其內容包括:
在尋找最佳分割點時,XGBoost根據百分位法列舉幾個可能成為分割點的候選者,從候選者中根據步驟S103中的公式計算找出最佳的分割點;
XGBoost考慮了訓練數據為稀疏值的情況,可以為缺失值或者指定的值指定分支的默認方向;
特征列排序后以塊的形式存儲在內存中,在迭代中可以重復使用。
6.根據權利要求1所述的一種基于XGBoost模型的森林火災風險預測算法,其特征在于,所述的步驟S202中,預測樣本的分數包括:
根據該樣本的特征,在每棵決策樹中會落到對應的一個葉子結點,每個葉子結點對應一個分數。
7.根據權利要求6所述的一種基于XGBoost模型的森林火災風險預測算法,其特征在于,所述步驟S203中,XGBoost中使用了二階導數,使用泰勒展開取得函數做自變量的二階導數形式,可以在未選定損失函數具體形式的情況下,僅依靠輸入數據的值進行葉子分裂優化計算。
8.根據權利要求1所述的一種基于XGBoost模型的森林火災風險預測算法,其特征在于,所述基于XGBoost模型的森林火災風險預測算法還包括參數調整的步驟:
S301、設定固定的實驗條件,設定verbosity=1;基分類器booster=gbtree;目標函數objective=multi:softmax;評價指標eval_metric=mlogloss;分類類別num_class=5;L2正則化系數lambda=2;
S302、對于其余的可調參數,設計調參函數,借助GridSearchCV函數,兩個可調參數為一組,分組進行多次重復實驗,設定交叉驗證參數cv=5,經過粗調-細調兩步,最終得到適合的模型參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于亞太衛星寬帶通信(深圳)有限公司,未經亞太衛星寬帶通信(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310566771.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于分布式光伏故障判斷方法
- 下一篇:銑削設備和銑刀自動找平方法





