[發(fā)明專利]一種基于特征空間的雙核多向偏最小二乘的發(fā)酵過程質(zhì)量預測方法有效
| 申請?zhí)枺?/td> | 201410075308.2 | 申請日: | 2014-03-03 |
| 公開(公告)號: | CN103810396B | 公開(公告)日: | 2016-10-19 |
| 發(fā)明(設計)人: | 王普;王錫昌;高學金;齊詠生 | 申請(專利權)人: | 北京工業(yè)大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 北京思海天達知識產(chǎn)權代理有限公司 11203 | 代理人: | 劉萍 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 特征 空間 多向 最小 發(fā)酵 過程 質(zhì)量 預測 方法 | ||
技術領域
本發(fā)明屬于生物發(fā)酵領域,又屬于信息科學領域,具體涉及在發(fā)酵過程中應用基于特征空間的雙核多向偏最小二乘建立發(fā)酵過程的預測模型用于預測在線測量中難以及時取得的質(zhì)量變量。
背景技術
發(fā)酵過程是采用現(xiàn)代生物工程技術,利用有益的微生物進行的生產(chǎn)活動,應用的微生物或微生物產(chǎn)物能夠產(chǎn)生大量的經(jīng)濟效益。發(fā)酵過程為生物技術的重要組成部分,在制藥、醫(yī)療、食品、化工、環(huán)境等領域中有著舉足輕重的社會和經(jīng)濟價值。國家發(fā)改委、工信部發(fā)布的《食品工業(yè)十二五發(fā)展規(guī)劃》寫到,到2015年,發(fā)酵工業(yè)總產(chǎn)值將會達到4600億元以上,年均增長率達15%以上。生物技術、藥物在《醫(yī)藥工業(yè)“十二五”發(fā)展規(guī)劃》中也被確定為發(fā)展的重點領域。
發(fā)酵過程中很大一部分過程屬于間歇過程,而現(xiàn)代工業(yè)間歇過程傾向于向小型化,快捷化,高附加值化發(fā)展,在這過程中可以測量的數(shù)據(jù)也越來越多。但是某些數(shù)據(jù),例如菌體濃度,產(chǎn)物濃度等,具有兩個特點,一個是這些數(shù)據(jù)與產(chǎn)品質(zhì)量具有很強的相關性,甚至直接影響著產(chǎn)品的合格率;第二個是這些數(shù)據(jù)并不容易在線測量,往往傳統(tǒng)的測量方法在測量這些數(shù)據(jù)的時候相對其它易獲得的數(shù)據(jù)具有一定的滯后,并不能及時的反應生產(chǎn)狀況,這會影響操作人員對整個生產(chǎn)過程的監(jiān)視和操作,甚至有可能因為不能夠及時做出判斷而延誤關鍵控制機會。針對這個問題,國內(nèi)外的研究重點分為兩大類,一類是定性的分析,比如專家系統(tǒng),這種方式雖然能夠結(jié)合以往的生產(chǎn)經(jīng)驗,但是預測結(jié)果往往比較模糊;另一類是定量的分析,比如機理模型建模,這種方式雖然能夠較精確的解釋生產(chǎn)過程并對數(shù)據(jù)進行預測,但是由于生產(chǎn)過程機理復雜,前期機理分析困難,且實際應用時依然需要調(diào)整大量參數(shù)。基于數(shù)據(jù)驅(qū)動的分析方法屬于定量分析技術的一種,其中偏最小二乘對于訓練數(shù)據(jù)量要求較少,運算復雜度較低,解釋效果較好而得到了廣泛的應用。但是它處理的是線性問題,對于生產(chǎn)過程這種非線性程度較高的對象處理存在不可忽視的缺點。
為了解決過程的非線性問題,核技巧被應用到偏最小二乘算法中。核技巧能夠處理生產(chǎn)數(shù)據(jù)的非線性問題,通過將采集到的數(shù)據(jù)投影到高維空間中降低數(shù)據(jù)本身的非線性度,進而可以在核空間中可以應用偏最小二乘算法對數(shù)據(jù)進行分析,這種方法能夠較顯著的提高整體的預測精度,但是依然存在問題。在偏最小二乘建模時數(shù)據(jù)是分為兩組的,一組為測量數(shù)據(jù),可以實時測量得到,另一組為質(zhì)量數(shù)據(jù),這些數(shù)據(jù)并不能夠或者很難實時采集。所以,生產(chǎn)過程中雖然能夠得到相同時刻的測量數(shù)據(jù)和質(zhì)量數(shù)據(jù),但是質(zhì)量數(shù)據(jù)結(jié)果的取得往往存在一定滯后。偏最小二乘算法就是計算這兩組數(shù)據(jù)間的關系,找到以測量數(shù)據(jù)計算質(zhì)量數(shù)據(jù)的方法,起到實時預測質(zhì)量數(shù)據(jù)的作用。核技巧將測量數(shù)據(jù)投影到高維空間中,投影之后的數(shù)據(jù)依然能夠進行計算,但是將質(zhì)量數(shù)據(jù)投影到高維空間中,降低質(zhì)量數(shù)據(jù)的非線性度的問題并沒有得到研究,并且,如何對投影到高維空間中的質(zhì)量數(shù)據(jù)進行計算得到真實的質(zhì)量數(shù)據(jù)也是問題。
發(fā)明內(nèi)容
本發(fā)明針對間歇過程的非線性問題,提出一種基于特征空間的雙核處理多向偏最小二乘算法,用核空間向量預測投影到核空間的質(zhì)量數(shù)據(jù)。解決了傳統(tǒng)核技巧難以考慮質(zhì)量數(shù)據(jù)Y的非線性的問題,提高了模型的預測精度。
本發(fā)明采用了如下的技術方案和實現(xiàn)步驟:
1、一種基于特征空間的雙核多向偏最小二乘的發(fā)酵過程質(zhì)量預測方法,其特征在于包含以下步驟:
步驟(1):獲取訓練數(shù)據(jù):
采集發(fā)酵過程中可在線測量的測量變量和難以在線測量的質(zhì)量變量形成訓練數(shù)據(jù),具體的一次數(shù)據(jù)采樣表示形式如下:
X=(x1,x2,...,xnx)?????????(1)
Y=(y1,y2,...,yny)??????????(2)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業(yè)大學,未經(jīng)北京工業(yè)大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410075308.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應用的數(shù)字計算或數(shù)據(jù)處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質(zhì)相關的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡,蛋白質(zhì)交互作用網(wǎng)絡或新陳代謝作用網(wǎng)絡
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學或蛋白質(zhì)組學的,例如:基因型–表型關聯(lián),不均衡連接,種群遺傳學,結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用





