[發(fā)明專利]一種多極限學(xué)習(xí)機(jī)模型構(gòu)建方法、裝置及計算機(jī)設(shè)備在審
| 申請?zhí)枺?/td> | 202010929560.0 | 申請日: | 2020-09-07 |
| 公開(公告)號: | CN112070157A | 公開(公告)日: | 2020-12-11 |
| 發(fā)明(設(shè)計)人: | 李意芬;陳治亞;汪運 | 申請(專利權(quán))人: | 中南大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/18;G06F17/16;G06N20/00 |
| 代理公司: | 長沙軒榮專利代理有限公司 43235 | 代理人: | 齊超 |
| 地址: | 410000 湖南*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多極 學(xué)習(xí)機(jī) 模型 構(gòu)建 方法 裝置 計算機(jī) 設(shè)備 | ||
涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及基于無限混合高斯分布的多極限學(xué)習(xí)機(jī)模型的構(gòu)建方法、裝置及計算機(jī)設(shè)備。本發(fā)明通過建立多極限學(xué)習(xí)機(jī)模型(MELM),使用無限混合高斯分布(IMoG)來擬合模型MELM的回歸誤差,采用稀疏貝葉斯學(xué)習(xí)方法來優(yōu)化模型MELM中的輸出權(quán)重和模型權(quán)重,同時采用變分貝葉斯的方法對模型中所有參數(shù)進(jìn)行優(yōu)化,獲得一個緊致的預(yù)測模型,預(yù)測效果良好,不僅具有超強(qiáng)的魯棒性能,可以避免預(yù)先確定MoG中單個高斯分布的數(shù)量,并且在給定模型參數(shù)初始值的情況下可以自動獲得模型中所有參數(shù)的概率分布。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種多極限學(xué)習(xí)機(jī)模型構(gòu)建方法、裝置及計算機(jī)設(shè)備。
背景技術(shù)
在大數(shù)據(jù)時代,數(shù)據(jù)量越來越龐大,對研究對象的大規(guī)模信息獲取相對也變的更容易,同時數(shù)據(jù)采集過程中的人為或儀器設(shè)備等因素,數(shù)據(jù)難免會存在一些異常點,這些點對所要建立的模型的性能會產(chǎn)生極大的影響,因此有必要開發(fā)對異常點有一定魯棒性的回歸模型。
現(xiàn)有技術(shù)中通常采用兩種方法處理帶異常點的回歸問題:數(shù)據(jù)預(yù)處理方法和魯棒回歸模型。數(shù)據(jù)預(yù)處理方法有兩類:基于異常點檢測的數(shù)據(jù)處理方法的和信號處理方法。前者僅僅對異常點進(jìn)行處理,通常采用統(tǒng)計、基于距離、基于密度的模型和軟計算技術(shù)來檢測異常點,再將這些點從訓(xùn)練數(shù)據(jù)中刪除;后者通常使用信號處理方法(例如小波變換)對原始的數(shù)據(jù)中所有的樣本點進(jìn)行預(yù)處理,以減少異常點或未知噪聲的不利影響。魯棒回歸模型通過設(shè)計魯棒損失函數(shù)的原則是使損失函數(shù)的值不會隨著誤差的增加而改變太多,常見的策略是將權(quán)重添加到不同的樣本中,如Hurbe,Hampel,Logistic和Myriad加權(quán)函數(shù),進(jìn)而得出加權(quán)的損失函數(shù),如基于lncosh損失函數(shù)開發(fā)了魯棒的支持向量機(jī)、基于最小絕對偏差損失函數(shù)的魯棒最小二乘支持向量機(jī)。
上述對異常點或者未知噪聲更魯棒的回歸模型雖然能夠較為精確的預(yù)測結(jié)果,但是數(shù)據(jù)預(yù)處理方法無法確定是否檢測到所有的異常點并對其進(jìn)行了預(yù)處理,采用損失函數(shù)一方面難于優(yōu)化,另一方面無法對真實的復(fù)雜的誤差分布進(jìn)行全面刻畫。
發(fā)明內(nèi)容
基于此,本發(fā)明針對上述的問題,提供了一種多極限學(xué)習(xí)機(jī)模型構(gòu)建方法,旨在解決現(xiàn)有異常點檢測回歸模型難于優(yōu)化,無法對真實的復(fù)雜的誤差分布進(jìn)行全面刻畫的技術(shù)問題。
本發(fā)明提供了一種多極限學(xué)習(xí)機(jī)模型構(gòu)建方法,具體包括:
獲取多個含有不同隱含層節(jié)點數(shù)的單極限學(xué)習(xí)機(jī)模型,并賦予所述單極限學(xué)習(xí)機(jī)模型權(quán)重值,構(gòu)建多極限學(xué)習(xí)機(jī)模型;所述多極限學(xué)習(xí)機(jī)模型包括輸出值向量,模型權(quán)值向量和誤差項;
在貝葉斯框架下,根據(jù)截棍構(gòu)建理論構(gòu)建所述誤差項的分布權(quán)重,獲取誤差項無限混合高斯分布;
獲取用戶給定的輸出權(quán)值向量和模型權(quán)值向量,獲得所述輸出權(quán)值向量和模型權(quán)值向量的稀疏先驗分布;
根據(jù)所述誤差項混合高斯分布、輸出權(quán)值向量和模型權(quán)值向量的稀疏先驗分布獲得數(shù)據(jù)和所述多極限學(xué)習(xí)機(jī)模型中參數(shù)集合的聯(lián)合概率;以及
將所述聯(lián)合概率中的參數(shù)采用變分貝葉斯方法推斷,獲得所述多極限學(xué)習(xí)機(jī)模型參數(shù)的后驗分布。
更進(jìn)一步地,所述在貝葉斯框架下,根據(jù)截棍構(gòu)建理論構(gòu)建所述誤差項的分布權(quán)重,獲取誤差項無限混合高斯分布具體包括:
在貝葉斯框架下,引入指標(biāo)變量zik,誤差項的混合高斯分布可表示為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中南大學(xué),未經(jīng)中南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010929560.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 構(gòu)建墊、實體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





