[發明專利]一種基于大數據分析的植物長勢預測方法有效
| 申請號: | 202011240219.0 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112270129B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 王相;寧彥吉;于進福;趙曉龍 | 申請(專利權)人: | 威海精訊暢通電子科技有限公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06F18/214;G06N20/20 |
| 代理公司: | 濟南舜源專利事務所有限公司 37205 | 代理人: | 張營磊 |
| 地址: | 264200 山東省威海市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 分析 植物 長勢 預測 方法 | ||
1.一種基于大數據分析的植物長勢預測方法,其特征在于,包括如下步驟:
S1:使用預設裝置采集植物的環境數據;
S2:對采集的環境數據進行數據清洗、數據刪除及替換、數據轉變處理,完成環境數據的預處理;
S3:將預處理后的環境數據進行探索性數據分析,并通過RFE-CV進行特征選擇;
S4:對處理后的環境數據進行劃分,劃分成訓練集、驗證集,并進行歸一化或者標準化處理,用訓練集訓練模型,驗證集調優模型,選擇最優的模型作為預測模型并進行保存;
S5:采集當前環境數據作為測試集,將測試集輸入到預測模型中,生成植物的預測株高與葉面積;
所述步驟S5具體為:
采集當前環境數據作為測試集,使用選擇好的預測模型對測試集進行預測,預測模型將內部多個決策樹的預測結果取平均值得到最終結果,根據最終結果輸出植物的預測株高與葉面積;
所述預測模型將內部多個決策樹的預測結果取平均值得到最終結果具體包括如下步驟:
S51:針對每一輸入樣本,從二叉決策樹的根節點起,判斷當前節點是否為葉子節點,如果是,返回葉子節點預測值;如果不是,轉到步驟S52;
S52:根據當前節點的最優切分變量和切分值,將樣本中對應變量的值與節點的切分值對比,如果樣本變量小于當前節點切分值,則訪問當前節點左子樹節點;如果樣本變量值大于當前子節點切分值,則訪問當前節點右子樹節點;
S53:循環步驟S52,直到訪問到最終的葉子節點或小于預設閾值的葉子節點為止,并返回節點預測值的平均值。
2.根據權利要求1所述的基于大數據分析的植物長勢預測方法,其特征在于,所述環境數據包括:空氣溫濕度、CO2濃度、光照強度、營養液溫度、株高和葉面積。
3.根據權利要求2所述的基于大數據分析的植物長勢預測方法,其特征在于,所述步驟S1包括:
使用預設傳感器采集空氣溫濕度、CO2濃度、光照強度和營養液溫度,使用卷尺測量株高,使用葉面積測試儀測量葉面積。
4.根據權利要求1所述的基于大數據分析的植物長勢預測方法,其特征在于,所述步驟S2包括:
S21:采用KNN模型對環境數據進行預測填充,將部分缺失數據補全;
S22:通過預設工具計算環境數據中的缺失值占比,查找環境數據的異常值和重復值,對缺失值數據占比異常、存在重復值和異常值的環境數據做刪除或替換處理;
S23:通過獨熱編碼的方式將環境數據有類別型變量轉變成數值型變量。
5.根據權利要求4所述的基于大數據分析的植物長勢預測方法,其特征在于,所述步驟S22具體為:
使用pandas科學計算庫中的統計數值的工具求出環境數據中每段數據的缺失值占比,通過表結構或者可視化的方式顯示出來,將缺失占比超出預設閾值的數據直接刪除;
通過數據的分布查找環境數據的異常值,對環境數據中存在的異常值的數據進行刪除或者使用預設的統計學方法進行替換處理;
查看環境數據中是否存在重復值,對存在重復值的環境數據進行整行刪除。
6.根據權利要求1所述的基于大數據分析的植物長勢預測方法,其特征在于,所述步驟S3包括:
S31:通過統計學皮爾遜相關系數或者數據可視化的熱力圖查看環境數據與目標之間的相關性;
S32:通過RFE-CV進行特征選擇,將非重要的特征剔除,保留和目標相關的特征;
S33:通過查看模型中的特征重要度來進行特征選擇。
7.根據權利要求1所述的基于大數據分析的植物長勢預測方法,其特征在于,所述步驟S4包括:
S41:選用隨機森林模型進行環境數據的建模預測,建模前將使用歸一化公式將環境數據進行歸一化處理、使用標準化公式對環境數據進行標準化處理;
S42:將環境數據的訓練集放入到隨機森林模型對模型進行訓練,模型使用bootstrap采樣從輸入訓練數據集中采集多個子訓練數據集來依次訓練多個決策樹;
S43:將訓練好的模型用環境數據的驗證集進行調優;
S44:采用K-fold交叉驗證方式選擇選擇最優的模型作為預測模型并進行保存。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于威海精訊暢通電子科技有限公司,未經威海精訊暢通電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011240219.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自動扶梯安全保護系統及其工作方法
- 下一篇:一種側向夾持定位機構
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





