[發(fā)明專利]一種基于即時學習局部模型的發(fā)酵過程故障監(jiān)測方法有效
| 申請?zhí)枺?/td> | 201610179985.8 | 申請日: | 2016-03-26 |
| 公開(公告)號: | CN105652845B | 公開(公告)日: | 2018-03-30 |
| 發(fā)明(設(shè)計)人: | 李亞芬;張亞堃;高學金;王錫昌;王普 | 申請(專利權(quán))人: | 北京工業(yè)大學 |
| 主分類號: | G05B19/418 | 分類號: | G05B19/418 |
| 代理公司: | 北京思海天達知識產(chǎn)權(quán)代理有限公司11203 | 代理人: | 劉萍 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 即時 學習 局部 模型 發(fā)酵 過程 故障 監(jiān)測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)驅(qū)動的故障診斷技術(shù)領(lǐng)域,尤其是涉及一種針對多階段發(fā)酵過程的故障監(jiān)測技術(shù)。本發(fā)明的基于數(shù)據(jù)驅(qū)動的方法是在青霉素發(fā)酵過程故障監(jiān)測方面的具體應(yīng)用。
背景技術(shù)
現(xiàn)代發(fā)酵工業(yè)過程規(guī)模不斷擴大、復雜性日益增高,人們對過程生產(chǎn)的安全性和可靠性越來越重視。流程工業(yè)過程數(shù)據(jù)存在高維、高度藕合、共線性、數(shù)據(jù)缺損以及噪聲污染等問題,而以主成分分析(PCA),主成分回歸(PCR)和偏最小二乘(PLS)等為核心技術(shù)的多元統(tǒng)計過程監(jiān)控(MSPM)方法可以較好地解決上述難題。其中,由于偏最小二乘可對系統(tǒng)中的數(shù)據(jù)信息進行分解和篩選,提取對因變量解釋性最強的綜合變量,克服變量多重相關(guān)性在系統(tǒng)建模中的不良作用,得到了廣泛應(yīng)用。
然而,發(fā)酵過程往往無穩(wěn)態(tài)的工作點,常常從一個穩(wěn)定狀態(tài)轉(zhuǎn)為另一個穩(wěn)定狀態(tài),具有動態(tài)性和時變特性。傳統(tǒng)偏最小二乘全局建模方法會在強動態(tài)例如過渡階段會產(chǎn)生誤報警。本發(fā)明將即時學習策略引入偏最小二乘建模中,提出種基于局部模型的發(fā)酵過程故障監(jiān)控策略。即時學習策略主要思想是從歷史數(shù)據(jù)集中挑選出與當前待測試的樣本最相關(guān)的樣本子集,再利用該樣本子集進行建模,最后用建立的局部模型分析當前待測試樣本。從而準確地反映過程運行的當前狀態(tài)變化,能有效地克服發(fā)酵過程存在的時變和多階段問題。
發(fā)明內(nèi)容
本發(fā)明提出的即時學習局部模型監(jiān)控方法首先將發(fā)酵過程數(shù)據(jù)按批次方向展開,然后根據(jù)當前時刻的待測試樣本設(shè)定遺忘因子對歷史數(shù)據(jù)加權(quán)并從中挑選出一定數(shù)量的相關(guān)樣本,最后用偏最小二乘方法對挑選出來的樣本進行建模并分析當前樣本是否為正常樣本,流程如圖1所示。該建模和監(jiān)控策略能很好地保留過程的局部鄰域信息,從而準確地反映過程運行的當前狀態(tài)變化,能有效地克服發(fā)酵過程存在的時變和多階段問題。
本發(fā)明所采用的技術(shù)方案,具體步驟如下所述:
步驟1,采集歷史正常同一發(fā)酵過程數(shù)據(jù),數(shù)據(jù)由生產(chǎn)某產(chǎn)品發(fā)酵過程的變量,批次,和每個批次的采樣點個數(shù)這三個維度組成。歷史數(shù)據(jù)由于比連續(xù)過程多了一個維度(批次),所以數(shù)據(jù)為三維的數(shù)據(jù)矩陣。
步驟2,對步驟1采集的三維數(shù)據(jù)矩陣進行變量展開,展開成二維的矩陣。具體展開步驟為將后一批次的第一個數(shù)據(jù)接在前一批次最后一個數(shù)據(jù)后面,相當于按照時間順序存儲所有數(shù)據(jù)。
步驟3,被監(jiān)測生產(chǎn)過程開始后,采集當前數(shù)據(jù),被檢測采樣點。當前樣本點為一個J維向量,其中J為生產(chǎn)過程被監(jiān)測的變量總數(shù)。
步驟4,計算當前樣本點與每個歷史樣本點馬氏距離。
步驟5,對馬氏距離從小到大排序,即相似的數(shù)據(jù)排名靠前,不相似的數(shù)據(jù)排名靠后。然后按照順序計算數(shù)據(jù)集的信息熵。熵表達一個系統(tǒng)混亂的程度,其中系統(tǒng)越混亂,其熵值就越高;反之,若系統(tǒng)越是有序,那么所對應(yīng)的熵值也就越低??上攵獎傞_始計算時數(shù)據(jù)點少,噪聲的信息量大,隨著計算信息熵的數(shù)據(jù)集所包含的樣本點增加,信息能夠概括整體階段,信息熵將減小,繼續(xù)引入將樣本點囊括到計算信息熵的數(shù)據(jù)集當中時其他階段的樣本點會被引入,這時系統(tǒng)信息再次豐富起來,信息熵將再次增大。利用這種自動選擇樣本方法,不需要先驗知識,排除了操作人員經(jīng)驗選取帶來的不確定性。具體操作為:先計算以第一個數(shù)據(jù)為數(shù)據(jù)集的信息熵,然后計算以第一個和第二個數(shù)據(jù)為數(shù)據(jù)集的信息熵,以此類推,依次增加,直到信息熵達到最小值為止,也就是由第一個數(shù)據(jù)到某個數(shù)據(jù)的數(shù)據(jù)集信息熵比第一個數(shù)據(jù)到某個數(shù)據(jù)的后一個數(shù)據(jù)的數(shù)據(jù)集信息熵要小,即相似點信息豐富性小。這表明數(shù)據(jù)點基本為一個階段內(nèi)的相似數(shù)據(jù)。那么選取由第一個數(shù)據(jù)到某個數(shù)據(jù)的數(shù)據(jù)集為相似樣本數(shù)據(jù)。
步驟6,對選取的樣本點進行歸一化處理。首先計算相似樣本點矩陣的每個過程變量的均值和標準方差。然后利用每個變量的均值和標準方差對每個變量進行Z-score標準化。同樣對當前在線樣本點進行Z-score標準化。
按照批次先后順序利用遺忘因子進行加權(quán)。由于時間較遠樣本可能不能表征較近時刻數(shù)據(jù)特征,所以基于較小權(quán)值。遺忘因子的表達式為:λi=e-αi,其中i表示數(shù)據(jù)所在的批次與當前批次數(shù)只差的絕對值,e為自然指數(shù),α為衰減因子,表示衰減速度,取0.6為通用值。這樣從時間上對相似樣本進行加權(quán)得到加權(quán)后的數(shù)據(jù)矩陣。
步驟7,用加權(quán)后的相似樣本點進行PLS建模,得到PLS模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學,未經(jīng)北京工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610179985.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





