[發(fā)明專利]一種Fast RVM污水處理故障診斷方法有效
| 申請?zhí)枺?/td> | 201610009907.3 | 申請日: | 2016-01-04 |
| 公開(公告)號: | CN105487526B | 公開(公告)日: | 2019-04-09 |
| 發(fā)明(設(shè)計)人: | 許玉格;鄧文凱;陳立定 | 申請(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號: | G05B23/02 | 分類號: | G05B23/02 |
| 代理公司: | 廣州市華學(xué)知識產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 陳宏升 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 故障診斷 向量機 多分類模型 數(shù)據(jù)擴充 采樣 聚類 污水 樣本 污水處理 虛擬 污水生化處理過程 污水生化處理系統(tǒng) 數(shù)據(jù)壓縮模塊 歸一化處理 不平衡性 數(shù)據(jù)壓縮 樣本屬性 歸一化 建模 量綱 一對一 剔除 | ||
1.一種Fast RVM污水處理故障診斷方法,其特征在于,包含以下順序的步驟:
S1.剔除污水輸入和輸出的數(shù)據(jù)中的異常點,對其進行歸一化處理,歸一化到[0,1]區(qū)間中;
S2.基于聚類的快速相關(guān)向量機多數(shù)類數(shù)據(jù)壓縮模塊,將訓(xùn)練樣本中的多數(shù)類樣本數(shù)據(jù)采用K-means方法進行聚類;具體過程如下:
S201、假設(shè)多數(shù)類樣本集X={x1,x2,…,xa,…,xn}為n個Rd空間的數(shù)據(jù),從n個數(shù)據(jù)對象中隨機選擇k個對象作為初始的聚類中心;
S202、然后對剩余的樣本對象則根據(jù)與各個聚類中心的距離分別分配到距離最相近的聚類中心中;計算距離的公式如下,假設(shè)cj為第j個類的中心,則xa與cj的距離為:
S203、根據(jù)集合中的點更新每個類的聚類中心,假設(shè)第j個類中的樣本為即包含了nj個樣本,則該類的聚類中心為其中為類中心cj的第b個屬性,計算公式如下:
S204、不斷重復(fù)S202、S203步驟,直到標準測度函數(shù)收斂為止,采用均方差作為計算標準測度函數(shù),其形式為:
將多數(shù)類樣本聚類后,對聚類后的樣本類別進行快速相關(guān)向量機分類建模,從而通過建模獲取相關(guān)向量;
S3.虛擬少數(shù)類向上采樣的少數(shù)類數(shù)據(jù)擴充模塊將訓(xùn)練樣本中的少數(shù)類樣本數(shù)據(jù)采用SMOTE進行數(shù)據(jù)擴充;
S4.將處理后的所有類的樣本數(shù)據(jù)重新組合構(gòu)成新的訓(xùn)練集,建立“一對一”的快速相關(guān)向量機多分類模型,對建好的分類模型輸入測試集進行投票,得到測試結(jié)果,從而實現(xiàn)對污水處理的整體運行狀態(tài)的識別。
2.根據(jù)權(quán)利要求1所述的Fast RVM污水處理故障診斷方法,其特征在于,所述的步驟S3,具體為:
S301、對少數(shù)類中的每一個樣本x,以歐幾里得距離為標準計算它到少數(shù)類樣本集中每個樣本的距離,獲得其中k個最近鄰,并記錄近鄰樣本的下標,這里k取5;
S302、根據(jù)向上采樣的倍率C,對每一個少數(shù)類樣本x,從其k個最近鄰中隨機選取C個樣本,記為y1,y2,…,yC;
S303、在原樣本x與yj之間進行隨機線性插值,構(gòu)造新的少數(shù)類樣本pj,即新樣本:
pj=x+rand(0,1)*(yj-x),j=1,2,…,C (4)
其中rand(0,1)表示區(qū)間(0,1)內(nèi)的一個隨機數(shù)。
3.根據(jù)權(quán)利要求1所述的Fast RVM污水處理故障診斷方法,其特征在于,步驟S4中,所述“一對一”的快速相關(guān)向量機多分類模型,其建立過程如下:
相關(guān)向量機是通過最大化邊際似然函數(shù)p(t|α,σ2)的方法確定超參數(shù)α和方差σ2的,等價于最大化為其對數(shù);記L(α)=log[p(t|α,σ2)],整理有:
其中C=σ2I+ΦA(chǔ)-1ΦT,t=[t1,t2,...,tN]T;
對矩陣C進行等價變換,如下:
其中此矩陣表示當(dāng)αi=∞時,相應(yīng)的基向量φi被移除后樣本對應(yīng)的協(xié)方差矩陣,根據(jù)矩陣相關(guān)性質(zhì)整理可得
因此公式(5)可以改寫為
其中L(α-i)表示為當(dāng)αi=∞時,相應(yīng)的基本向量φi被移除后所對應(yīng)的邊界似然函數(shù)的對數(shù),而l(αi)表示邊界似然的對數(shù)函數(shù)中只與αi有關(guān)的獨立部分;
公式(8)對αi求偏導(dǎo)有
記
所以公式(9)可改寫為
令公式(11)等于零,考慮到αi是方差值必須為正,所以當(dāng)時有
對L(α)關(guān)于αi求二階偏導(dǎo)有
綜合公式(11)和(12)進行分析可知
所以當(dāng)時,公式(14)左邊的表達式是恒小于零的,并對以上推導(dǎo)公式分析可得,L(α)有唯一最大值點為
根據(jù)上面的分析,通過以下方法最大化貝葉斯L(α):
A、當(dāng)基向量φi在模型中,即αi<∞,但有則將φi從模型中刪除,即令αi=∞;
B、當(dāng)基向量φi在模型中,即αi=∞,但有則將φi添加到模型中并利用公式(15)更新αi;
C、當(dāng)基向量φi在模型中,即αi<∞,但有則用公式(15)更新αi;
綜上所述,快速相關(guān)向量機分類基本算法步驟如下:
(1)初始化σ2=0;
(2)用單個基向量φi初始化αi,由公式(15)分析整理可得并設(shè)置其他的αm為無窮大,m≠i;
(3)計算Σ、μ并對所有M個基函數(shù)φm初始化Si和Qi;
(4)從所有M個基函數(shù)φm集合中選擇候選的基向量φi;
(5)計算
(6)若θi>0且αi<∞,重新估計αi;
(7)若θi>0且αi=∞,添加φi到模型中并重新估計αi;
(8)若θi≤0且αi<∞,刪除φi并設(shè)置αi=∞;
(9)用Laplace逼近方法重新計算協(xié)方差矩陣Σ,權(quán)重矩陣μ以及相應(yīng)迭代過程中的Si和Qi;
(10)若收斂或者達到最大迭代次數(shù),則終止程序;否則轉(zhuǎn)步驟(4);終止條件為:任意在模型中的基函數(shù)對應(yīng)的αi,有αi<1*10^12且
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610009907.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種多標記學(xué)習(xí)方法
- 一種數(shù)據(jù)對象的分類系統(tǒng)、方法以及設(shè)備
- 一種情感腦電信號識別方法及系統(tǒng)
- 多分類模型優(yōu)化方法、裝置、存儲介質(zhì)及電子設(shè)備
- 分類模型訓(xùn)練方法、分類方法、裝置及設(shè)備
- 基于模型融合的多類別情感分類方法
- 一種基于多分路通道擴容網(wǎng)絡(luò)的垃圾圖像分類方法
- 基于多模型的數(shù)據(jù)處理方法、裝置及分類建模的方法
- 多分類模型的訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)
- 基于二分類模型的多分類方法、裝置、電子設(shè)備及介質(zhì)





