[發明專利]一種基于隨機森林特征提取的BP神經網絡的數值預測方法在審
| 申請號: | 201910025537.6 | 申請日: | 2019-01-13 |
| 公開(公告)號: | CN109754122A | 公開(公告)日: | 2019-05-14 |
| 發明(設計)人: | 胡燕祝;王松 | 申請(專利權)人: | 胡燕祝 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06N3/08;G06N99/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數值預測 隨機森林 特征提取 預測 數據誤差 樣本 多組數據 機器學習 實驗對比 數據挖掘 特征輸入 特征選擇 預測結果 噪聲干擾 測試集 樣本集 量化 更新 保證 | ||
本發明涉及基于隨機森林特征提取的BP神經網絡的數值預測方法屬于機器學習和數據挖掘領域,其特征在于采用如下步驟:(1)選擇袋外數據X1(x1,x2,...,xn),計算袋外數據誤差error(1);(2)隨機對袋外數據所有樣本的特征T(t1,t2,...,tm)加入噪聲干擾,再次計算袋外數據誤差error(2);(3)計算所有特征T(t1,t2,...,tm)的重要性I;(4)確定重要性較大的特征T(t1,t2,...,ts)及其重要程度ω(ω1,ω2,...ωs);(5)訓練BP神經網絡,更新連接權值ωi;(6)將測試集樣本作為輸入,進行特征選擇然后將選擇好的特征輸入到BP神經網絡中進行預測,得到預測結果。本發明所建立的基于隨機森林特征提取的BP神經網絡的數值預測方法,用隨機森林提取樣本集的特征并對其重要性程度進行了量化,實現數值預測。通過多組數據實驗對比結果可知,該預測方法為數值預測,提供了在保證了預測精度的基礎上增強模型的泛化能力的預測方法。
技術領域
本發明涉及機器學習與數據挖掘領域,主要是一種數值預測方法。
背景技術
目前針對數值預測問題,大多數模型可以在很高的程度上擬合原始數據,但是模型泛化能力較差。這些模型往往在訓練集上表現出很好的預測性能,然而在測試集上或者一些新出現的數據中,預測能力會大大降低。神經網絡雖然具有很好的泛化能力,但是在模型訓練過程中收斂速度太慢,導致訓練時間過長,不能滿足數值預測對時效性的要求。以BP神經網絡為例,早期的BP神經網絡存在收斂速度慢,易陷入局部最優等問題。雖然BP神經網絡采用誤差反向傳播的方法來調整各層神經元之間的權值,但是在最初始建模的時候,輸入層神經元與第一個隱藏層神經元之間的連接權值是通過初始化的方法設定的隨機數,這可能是導致后續網絡訓練是陷入局部最優的一個原因。
我國在數值預測方面也取得了一些豐富成果。例如,利用深度學習在電力負荷、交通流量、空氣質量等方面實現了較好的數值預測。隨著計算機互聯網的飛速發展以及海量數據的指數級增長,對模型的特征選擇以及預測性能指標提出了更高的要求。因此,要實現準確、高效地對某些領域的數值進行預測,達到數值預測的要求,必須建立一種精確、泛化能力強的數值預測方法,進一步減小模型預測值與實際值之間的誤差,使得預測結果更加準確,為我國經濟和商業等領域提供一種精準、可靠的數值變化監測方式,為未來的發展和管理提供指導性意見。
發明內容
針對上述現有技術中存在的問題,本發明要解決的技術問題是提供一種精確、泛化能力強的數值預測方法,其具體流程如圖1所示。
技術方案實施步驟如下:
(1)選擇袋外數據X1(x1,x2,...,xn),計算袋外數據誤差error(1):
式中,g2,g3,...,gi是沒有抽到的袋外數據,N為樣本總數。
(2)隨機對袋外數據所有樣本的特征T(t1,t2,...,tm)加入噪聲干擾,再次計算袋外數據誤差error(2):
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于胡燕祝,未經胡燕祝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910025537.6/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





