[發明專利]一種基于不完整訓練數據集的蒸汽流量區間預測方法有效
| 申請號: | 201710938943.2 | 申請日: | 2017-10-11 |
| 公開(公告)號: | CN107704962B | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 趙珺;陳龍;韓中洋;王偉 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/04 |
| 代理公司: | 大連理工大學專利中心 21200 | 代理人: | 溫福雪;侯明遠 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 完整 訓練 數據 蒸汽 流量 區間 預測 方法 | ||
1.一種基于不完整訓練數據集的蒸汽流量區間預測方法,其特征在于如下步驟:
(1)數據準備與初始填補
從工業現場實時關系數據庫提取一段時間的冶金企業蒸汽流量時間序列數據,檢測并記錄時間序列中缺失點的位置,并用零值填補所有缺失點;
(2)基于相空間重構的輸入輸出樣本集構建
假設有一條含缺失點的離散時間序列{u(1),u(2),...,u(k),...,u(Nu)},其中u(k)表示第k個采樣時刻的時間序列值,Nu是序列的總長度;由式(1)構造第i個相矢量si(p):
si(p)=[u(i),u(i+τ),u(i+2τ),...,u(i+(p-1)τ)]T (1)
其中,i=1,2,...,N,而N=Nu-(p-1)τ/Δt,τ表示延遲時間,Δt表示數據的采樣間隔,p是相矢量的嵌入維數,也是矢量si(p)的長度;第i個相矢量si(p)同時表示輸入樣本集中的第i個輸入樣本,即xi=si(p),有xi=[xi1,xi2,...,xic,...,xip]T,其中xic是向量xi中的第c個分量,c=1,2,…,p;向量xi對應的目標值ti為式(2)所示:
ti=u(i+p×τ) (2)
此外,N個輸入樣本的矩陣形式為X=[x1,x2,...,xi,...,xN]T;N個目標值所組成的向量為t=[t1,t2,...,ti,...,tN]T;對于由含缺失點的時間序列構造的輸入輸出樣本集,事先記錄下輸入輸出中缺失點的對應關系;
(3)構建初始相關向量機回歸模型
假設第i個目標值ti與第i個輸入向量xi有如下的映射關系:
其中,j=0,1,2,…,N,xj是第j個輸入向量,且規定K(xi,x0)=1;另外,第i個基函數向量φi表示為φi=[1,K(xi,x1),K(xi,x2),...,K(xi,xj),...,K(xi,xN)]T,w=[w0,w1,...,wj,...,wN]T表示權值向量,K(xi,xj)=exp{-||xi-xj||2/2l2}是高斯核函數,其中,l≠0是核函數參數;εi表示第i個均值為0,方差為σ2的高斯分布噪聲項,β≡σ-2;對w中的每一個元素分別附加均值為0而方差不同的正態先驗分布:
其中,參數α=[α0,α1,...,αj,...,αN]T,αj是第j個權值wj的先驗方差的倒數,且有對角陣A=diag(α);并且同時將參數α和β視為隨機變量,并假設它們服從伽馬分布;
(4)基于不完整數據集的相關向量機回歸模型構建
構建最終預測模型就是要通過輸入輸出樣本集來迭代計算如下變量:
權值向量w;
缺失輸出向量t[m],即輸出集中所有缺失點組成的向量;
缺失輸入向量x[m],即輸入集中所有缺失點組成的向量;
噪聲方差參數β的點估計值;
具體步驟如下:
①初始化:向量α中的元素初始化為值1/N2,β[obs]初始化為10倍的t[obs]的方差,β[obs]是輸出集中可觀測點的噪聲方差的倒數,有β[obs]≡σ-2;其中,t[obs]表示輸出集中所有可觀測值組成的向量;相關向量集初始化為所有輸入樣本的集合,此時相關向量集中有N個樣本;
②分別使用式(5)和(6)更新w和t[m]的聯合后驗概率的均值μ[w,m|obs]和協方差矩陣Σ[w,m|obs];
其中,β=[β[m],β[m],...,β[m],β[obs],...,β[obs],β[obs]]T,β還可寫成寫成對角矩陣的形式是B[m]=diag(β[m]),B[obs]=diag(β[obs])和B=diag(β);矩陣B[m]和B[obs]大小分別為N[yobs]×N[yobs]和N[m]×N[m],而N[yobs]和N[m]分別表示輸出集中可觀測點和缺失點的個數,有N=N[yobs]+N[m],將β[m]設置為不小于108的值;另外,Φ表示核函數矩陣,有Φ=[φ1,φ2,...,φi,...,φN]T,并且將Φ表示成分塊矩陣的形式為其中和是由缺失輸出點和輸出可觀測點分別在輸出樣本集中的位置索引所提取的核矩陣Φ中以行為單位的行向量所組成的各自的新矩陣,大小分別為N[m]×(N+1)和N[yobs]×(N+1);
③采用(7)和(8)式更新αj和β[obs];
其中,且Tr(·)表示矩陣的求跡運算;
④如果αj>M,M設置為大于1010的值,將第j個樣本從相關向量集中除去;
⑤通過(9)式來計算x[m]中每一個元素的后驗概率均值,并填補到輸入集中輸入缺失點的相應位置,并進一步更新核矩陣Φ;
其中,x[m]集合中共有個輸入缺失點,x[m],v表示x[m]中的第v個元素,表示x[m],v的后驗概率均值;而t[m],corr_v表示第v個缺失輸入點在缺失輸出集t[m]中的對應變量值;t[m],corr_v的后驗概率p(t[m],corr_v|t[obs],α,β[obs])由式(5)和(6)得出;
⑥由(10)式計算對數邊緣似然度函數的值;
其中,協方差矩陣矩陣大小為N[yobs]×N[yobs],I是單位矩陣,log(·)表示自然對數運算;
⑦如果α中有元素相對上次迭代的變化或邊緣似然度函數值的變化小于給定的閾值,終止迭代過程,得出最終預測模型;否則,轉到第②步;
(5)單步迭代預測得出未來一段時間的預測區間
給定一個新的輸入樣本x*,此輸入向量中沒有缺失點,得出對應的輸出t*的預測分布近似為一個正態分布
其中,φ*=[1,K(x*,x1),K(x*,x2),...,K(x*,xN)]T,μ[w|obs]是權值向量w的后驗概率的均值,由式(8)計算得到;此時,預測上下限分別表示為
其中,Ulimit和Llimit分別表示置信區間為(1-χ%)的預測區間上下限,同時是標準高斯分布中對應概率為的分位數;未來一段時間的預測均值由單步迭代的方式給出;每一次預測輸出的預測均值是一個點,且下一輪的預測會將上一輪的預測結果作為輸入,進行循環滾動預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710938943.2/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





