[發(fā)明專利]一種基于數(shù)據(jù)分布的小樣本擴(kuò)充對(duì)脫丁烷塔底丁烷濃度進(jìn)行預(yù)測(cè)的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810402513.3 | 申請(qǐng)日: | 2018-04-28 |
| 公開(kāi)(公告)號(hào): | CN108647272B | 公開(kāi)(公告)日: | 2020-12-29 |
| 發(fā)明(設(shè)計(jì))人: | 熊偉麗;畢略 | 申請(qǐng)(專利權(quán))人: | 江南大學(xué) |
| 主分類號(hào): | G06F16/23 | 分類號(hào): | G06F16/23;G06F16/2458 |
| 代理公司: | 哈爾濱市陽(yáng)光惠遠(yuǎn)知識(shí)產(chǎn)權(quán)代理有限公司 23211 | 代理人: | 林娟 |
| 地址: | 214000 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 分布 樣本 擴(kuò)充 丁烷 濃度 進(jìn)行 預(yù)測(cè) 方法 | ||
本發(fā)明公開(kāi)了一種基于數(shù)據(jù)分布的小樣本擴(kuò)充方法,屬于復(fù)雜工業(yè)過(guò)程建模和軟測(cè)量領(lǐng)域。在基于數(shù)據(jù)驅(qū)動(dòng)理論的建模過(guò)程中,樣本的數(shù)量會(huì)對(duì)所建模型的精度產(chǎn)生影響。針對(duì)訓(xùn)練樣本數(shù)量較少導(dǎo)致模型信息缺失的問(wèn)題,該方法通過(guò)分析數(shù)據(jù)的分布特征來(lái)確定樣本擴(kuò)充的區(qū)間范圍,通過(guò)使用歐氏距離和角度原則進(jìn)行數(shù)據(jù)擴(kuò)充,利用擴(kuò)充數(shù)據(jù)完善建模對(duì)象在各階段的信息,并進(jìn)一步重構(gòu)建模數(shù)據(jù)集,能夠?qū)﹃P(guān)鍵變量進(jìn)行精確預(yù)測(cè),從而提高產(chǎn)品質(zhì)量,降低生產(chǎn)成本。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于數(shù)據(jù)分布的小樣本擴(kuò)充對(duì)脫丁烷塔底丁烷濃度進(jìn)行預(yù)測(cè)的方法,屬于復(fù)雜工業(yè)過(guò)程建模和軟測(cè)量領(lǐng)域。
背景技術(shù)
在工業(yè)過(guò)程復(fù)雜性日益增加,控制要求不斷提高的背景下,通常需要對(duì)一些無(wú)法或難以直接測(cè)量的質(zhì)量變量進(jìn)行監(jiān)控。這些變量有的雖然可用在線分析儀表進(jìn)行檢測(cè),但是價(jià)格昂貴,而且可靠性差、具有較大測(cè)量滯后,難以在實(shí)時(shí)檢測(cè)中廣泛的應(yīng)用。為了解決這類變量的估計(jì)和控制問(wèn)題,軟測(cè)量技術(shù)得到了很大的發(fā)展。軟測(cè)量的原理就是根據(jù)某種最優(yōu)準(zhǔn)則,通過(guò)選擇一組與主導(dǎo)變量(被估計(jì)變量)相關(guān)的一組輔助變量,建立以輔助變量為輸入,被估計(jì)變量的最優(yōu)估計(jì)為輸出的數(shù)學(xué)模型。
在數(shù)據(jù)驅(qū)動(dòng)的軟測(cè)量建模中,需要通過(guò)訓(xùn)練樣本來(lái)發(fā)掘模型對(duì)象的過(guò)程信息。在許多情況下一個(gè)完整工業(yè)過(guò)程是由多個(gè)子階段組成的。由于各子階段的特征信息是有差別的,所以在一些樣本較少的實(shí)際情況中,有限的小樣本難以準(zhǔn)確的表征過(guò)程的整體信息,從而導(dǎo)致所建模型的預(yù)測(cè)效果會(huì)受到影響。現(xiàn)有的方法都只局限于提高樣本質(zhì)量或改進(jìn)建模方法這兩個(gè)方面,沒(méi)有從樣本數(shù)量的角度出發(fā),來(lái)提升模型的泛化性能和預(yù)測(cè)精度。
發(fā)明內(nèi)容
在一些樣本較少的實(shí)際情況中,有限的小樣本難以準(zhǔn)確的表征過(guò)程的整體信息,從而導(dǎo)致主導(dǎo)變量估計(jì)不準(zhǔn)確的問(wèn)題,在此情況下,若對(duì)小樣本數(shù)據(jù)進(jìn)行某種選擇性的擴(kuò)充,可以使得擴(kuò)充后樣本更加全面的包含各階段的特征信息。進(jìn)一步利用重構(gòu)的建模數(shù)據(jù)集進(jìn)行建模,將會(huì)大大提高所建模型對(duì)主導(dǎo)變量的預(yù)測(cè)精度。
本發(fā)明考慮小樣本建模的情況,首先通過(guò)分析實(shí)際的工業(yè)過(guò)程,得到數(shù)據(jù)的分布特征,然后再對(duì)已有的小樣本進(jìn)行分組和輔助變量的歸一化處理,在數(shù)據(jù)信息不充足的子區(qū)間內(nèi),利用歐氏距離和角度原則,選擇相似樣本進(jìn)行樣本擴(kuò)充,使得重構(gòu)的樣本集可以更加全面的表征模型各階段的信息,提升了所建模型的預(yù)測(cè)精度。
為了解決目前存在的由于有限的小樣本不能完整準(zhǔn)確的表征工程的整體信息從而導(dǎo)致主導(dǎo)變量估計(jì)不準(zhǔn)確的問(wèn)題,本發(fā)明提供一種基于數(shù)據(jù)分布的小樣本擴(kuò)充方法,所述技術(shù)方案如下:
步驟1:對(duì)工業(yè)過(guò)程數(shù)據(jù)進(jìn)行歸一化處理,即令x'=(x-xmin)/(xmax-xmin),其中x為原始訓(xùn)練樣本,x'為歸一化處理后的訓(xùn)練樣本,xmin和xmax分別為原始訓(xùn)練樣本集中的最小值與最大值,所述工業(yè)過(guò)程數(shù)據(jù)的初始樣本符合期望為μ、標(biāo)準(zhǔn)差為σ的對(duì)數(shù)正態(tài)分布;
所述工業(yè)過(guò)程數(shù)據(jù)的初始樣本數(shù)量少于50或原始訓(xùn)練樣本所包含的過(guò)程信息不完整;
步驟2:計(jì)算原始訓(xùn)練樣本中每個(gè)ln(Yk)的值(其中k=1,…,m),m為原始訓(xùn)練樣本數(shù),并找到原始訓(xùn)練樣本中主導(dǎo)變量的最大值Ymax和最小值Ymin;
所述原始訓(xùn)練樣本中包括主導(dǎo)變量和輔助變量;其中,所述主導(dǎo)變量為需要預(yù)測(cè)的變量,所述輔助變量為直接測(cè)得的變量;
步驟3:根據(jù)正態(tài)分布的3σ原則,將區(qū)間(μ-3σ,μ+3σ)作為隨機(jī)變量ln(Y)實(shí)際的取值區(qū)間,并且落在區(qū)間(μ-3σ,μ-2σ)、(μ-2σ,μ-σ)、(μ-σ,μ)、(μ,μ+σ)、(μ+σ,μ+2σ)、(μ+2σ,μ+3σ)上的概率分別為2.1%、13.6%、34.1%、34.1%、13.6%、2.1%;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江南大學(xué),未經(jīng)江南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810402513.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)





