[發明專利]基于層次聚類和神經網絡的負荷預測輸入特征篩選方法在審
| 申請號: | 201910294713.6 | 申請日: | 2019-04-12 |
| 公開(公告)號: | CN110135623A | 公開(公告)日: | 2019-08-16 |
| 發明(設計)人: | 丁研;宿皓;王翹楚;張震勤 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/06;G06N3/02 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程小艷 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 負荷預測 層次聚類 神經網絡 輸入特征 篩選 預測 輸入數據集 原始數據集 保留數據 建筑負荷 有效特征 分析 數據集 特征集 聚類 剔除 優化 保證 | ||
1.基于層次聚類和神經網絡的負荷預測輸入特征篩選方法,其特征在于,包括以下步驟:
1)對負荷預測的原始數據進行層次聚類分析,得到負荷預測輸入數據的有層次的嵌套聚類樹;
2)根據層次聚類中的簇間距離確定建筑負荷預測輸入參數聚類簇個數;
3)利用神經網絡對每一類的數據中不同參數的預測效果進行判斷,剔除預測較差的參數,得到優化的負荷預測輸入特征集。
2.根據權利1所述的基于層次聚類和神經網絡的負荷預測輸入特征篩選方法,其特征在于,所述層次聚類采用“自底向上”的聚合策略,將數據集中每一個樣本看作一個初始聚類簇,每一步聚合將距離最近的兩個聚類簇進行合并,不斷重復直到聚合為一個聚類簇。
3.根據權利2所述的基于層次聚類和神經網絡的負荷預測輸入特征篩選方法,其特征在于,所述距離函數采用歐氏距離函數,表達式如下:
對樣本xi=(xi1;xi2;…;xi3)和xj=(xj1;xj2;…;xj3),距離函數dist(·,·)為:
4.根據權利2所述的基于層次聚類和神經網絡的負荷預測輸入特征篩選方法,其特征在于,所述簇間距離采用平均距離進行計算,表達式如下:
對于給定聚類簇Ci和Cj,簇間距離為:
5.根據權利1所述的基于層次聚類和神經網絡的負荷預測輸入特征篩選方法,其特征在于,利用聚類過程中每次聚合所采用的簇間距離之間的大小關系作為選取最終聚類簇個數的依據;根據簇間距離小形成的聚類簇的相似性大,類間距離大形成的類的相似性小的原則:若該次聚合所采用的簇間距離的增加值明顯比之前聚合時的簇間距離大,則將該次聚合前的聚類簇數即為最終所分聚類的聚類簇數。
6.根據權利1所述的基于層次聚類和神經網絡的負荷預測輸入特征篩選方法,其特征在于,所述優化的負荷預測輸入數據集的構成方法為,剔除每一聚類簇中預測效果最不好的神經網絡模型對應的參數,所構成的數據集即為最終的優化的負荷預測輸入特征集。
7.根據權利1所述的基于層次聚類和神經網絡的負荷預測輸入特征篩選方法,其特征在于,所述預測效果判斷步驟為:
(1)針對每一聚類簇內的不同參數建立測試集,測試集內包含該參數所在聚類簇外的其他聚類簇的全部參數,不包含該聚類簇內除該參數外的其他參數;
(2)對每一個測試集針對同一個預測目標建立結構相同的神經網絡模型;
(3)將神經網絡的預測結果作為評價對應參數的預測效果的依據;
(4)利用均方根誤差(RMSE)、平均絕對誤差(MAE)、確定性系數(R2)和均方根誤差變異系數(CV-RMSE)作為對不同參數的預測效果的評價指標,計算方法定義如下:
其中:Fi——實際測量值;
Fi′——模型預測值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910294713.6/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





