[發(fā)明專利]基于核極限學(xué)習(xí)機(jī)的樣本處理方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010841786.5 | 申請日: | 2020-08-20 |
| 公開(公告)號(hào): | CN111985103A | 公開(公告)日: | 2020-11-24 |
| 發(fā)明(設(shè)計(jì))人: | 熊偉麗;代學(xué)志 | 申請(專利權(quán))人: | 江南大學(xué) |
| 主分類號(hào): | G06F30/20 | 分類號(hào): | G06F30/20;G06N20/00 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 樓高潮 |
| 地址: | 214122 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 極限 學(xué)習(xí)機(jī) 樣本 處理 方法 系統(tǒng) | ||
本發(fā)明提供基于核極限學(xué)習(xí)機(jī)的樣本處理方法及系統(tǒng),方法包括:識(shí)別預(yù)處理樣本集中的無標(biāo)記樣本及有標(biāo)記樣本,確定無標(biāo)記樣本集及有標(biāo)記樣本集作為處理對象;基于KELM算法從所述無標(biāo)記樣本集中選取滿足預(yù)設(shè)要求的無標(biāo)記樣本,構(gòu)成第一子樣本集;將所述第一子樣本集中的樣本進(jìn)行標(biāo)記,得到帶有標(biāo)記的第二子樣本集,將第二子樣本集加入所述有標(biāo)記樣本集,得到更新后的有標(biāo)記樣本集;若所述有標(biāo)記樣本集與更新后的有標(biāo)記樣本集的相似度滿足預(yù)設(shè)要求,則基于更新后的有標(biāo)記樣本集進(jìn)行軟測量。本方案,迭代更新速度快,穩(wěn)定性高,應(yīng)用于復(fù)雜化工過程建模,可大大降低主動(dòng)學(xué)習(xí)的運(yùn)算成本,并減少人工標(biāo)記代價(jià),更有效地實(shí)現(xiàn)過程質(zhì)量變量的軟測量。
技術(shù)領(lǐng)域
本發(fā)明屬于工業(yè)生產(chǎn)過程軟測量建模和應(yīng)用領(lǐng)域,特別涉及一種基于核極限學(xué)習(xí)機(jī)的樣本處理方法及系統(tǒng)。
背景技術(shù)
在復(fù)雜工業(yè)過程中,需要對一些決定產(chǎn)品質(zhì)量的關(guān)鍵變量進(jìn)行監(jiān)測和控制,但由于現(xiàn)場環(huán)境以及技術(shù)條件的制約,使得這些變量難以在線測量。軟測量是工業(yè)過程中用于解決難測變量檢測的常用技術(shù),通過訓(xùn)練集構(gòu)建數(shù)學(xué)模型,實(shí)現(xiàn)對新樣本質(zhì)量變量的實(shí)時(shí)估計(jì)。常見的軟測量模型包括支持向量回歸、人工神經(jīng)網(wǎng)絡(luò)、高斯過程回歸和極限學(xué)習(xí)機(jī)等。
軟測量技術(shù)通常需要大量有標(biāo)記樣本才能完成模型訓(xùn)練,而在實(shí)際工業(yè)過程中常常是無標(biāo)記樣本數(shù)量多,有標(biāo)記樣本數(shù)量較少,而且獲取成本高。在這種情況下,如何利用大量無標(biāo)記數(shù)據(jù)和少量標(biāo)記數(shù)據(jù)來提升模型性能成為軟測量建模的關(guān)鍵問題。采用上述軟測量模型穩(wěn)定性較差,在復(fù)雜化工過程建模時(shí)運(yùn)算成本較高。
發(fā)明內(nèi)容
本發(fā)明提供一種基于核極限學(xué)習(xí)機(jī)的樣本處理方法及系統(tǒng),以解決現(xiàn)有技術(shù)方案中軟測量模型穩(wěn)定性較差,在復(fù)雜化工過程建模時(shí)運(yùn)算成本較高的技術(shù)問題。
第一方面,根據(jù)本發(fā)明實(shí)施例提供的基于核極限學(xué)習(xí)機(jī)的樣本處理方法,應(yīng)用于軟測量中,包括:
步驟S12、識(shí)別預(yù)處理樣本集中的無標(biāo)記樣本及有標(biāo)記樣本,確定無標(biāo)記樣本集及有標(biāo)記樣本集作為處理對象;
步驟S14、基于KELM算法從所述無標(biāo)記樣本集中選取滿足預(yù)設(shè)要求的無標(biāo)記樣本,構(gòu)成第一子樣本集;
步驟S16、將所述第一子樣本集中的樣本進(jìn)行標(biāo)記,得到帶有標(biāo)記的第二子樣本集,將第二子樣本集加入所述有標(biāo)記樣本集,得到更新后的有標(biāo)記樣本集;其中,在對第一子樣本集中的樣本進(jìn)行標(biāo)記之后,從所述無標(biāo)記樣本集中去除所述第一子樣本集中的樣本,得到更新后的無標(biāo)記樣本集;
步驟S18、若所述有標(biāo)記樣本集與更新后的有標(biāo)記樣本集的相似度滿足預(yù)設(shè)要求,則基于更新后的有標(biāo)記樣本集進(jìn)行軟測量。
在一個(gè)實(shí)施例中,所述方法,還包括:
若所述有標(biāo)記樣本集與更新后的有標(biāo)記樣本集的相似度不滿足預(yù)設(shè)要求,則確定更新后的有標(biāo)記樣本集與更新后的無標(biāo)記樣本集構(gòu)成的樣本集為預(yù)處理樣本集,并迭代執(zhí)行步驟S12、步驟S14、步驟S16及步驟S18,直到第K次更新后的有標(biāo)記樣本與第K-1次更新后的有標(biāo)記樣本的相似度滿足要求,則基于第K次更新后的有標(biāo)記樣本進(jìn)行軟測量。
在一個(gè)實(shí)施例中,所述基于KELM算法從所述無標(biāo)記樣本集中選取滿足預(yù)設(shè)要求的無標(biāo)記樣本,構(gòu)成第一子樣本集,包括:
計(jì)算所述無標(biāo)記樣本集中的無標(biāo)記樣本的置信度;
選取置信度滿足預(yù)設(shè)要求的無標(biāo)記樣本,構(gòu)成第一子樣本集。
在一個(gè)實(shí)施例中,所述方法,還包括:
步驟S171、分別求取第k-1次更新后的有標(biāo)記樣本的協(xié)方差矩陣Rk及第k次更新后的有標(biāo)記樣本的協(xié)方差矩陣Rk+1;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江南大學(xué),未經(jīng)江南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010841786.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:多乘客乘坐車輛
- 下一篇:領(lǐng)域短語詞典構(gòu)建方法





