[發(fā)明專利]基于固定預(yù)算的核嶺回歸在線學(xué)習(xí)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810593893.3 | 申請(qǐng)日: | 2018-06-11 |
| 公開(公告)號(hào): | CN108875962A | 公開(公告)日: | 2018-11-23 |
| 發(fā)明(設(shè)計(jì))人: | 宋允全;高富豪;梁錫軍;漸令 | 申請(qǐng)(專利權(quán))人: | 中國石油大學(xué)(華東) |
| 主分類號(hào): | G06N99/00 | 分類號(hào): | G06N99/00;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 266580 山*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 在線學(xué)習(xí) 核嶺回歸 在線預(yù)測(cè) 計(jì)算復(fù)雜度 預(yù)算 批處理 數(shù)據(jù)流特征 數(shù)據(jù)流 存儲(chǔ)空間 低秩矩陣 分類問題 高效處理 數(shù)值實(shí)驗(yàn) 學(xué)習(xí)樣本 有效控制 數(shù)據(jù)塊 預(yù)測(cè)器 求解 校正 集合 回歸 節(jié)約 靈活 更新 | ||
本發(fā)明涉及一種基于固定預(yù)算的核嶺回歸在線學(xué)習(xí)方法,首先通過數(shù)值實(shí)驗(yàn)確定預(yù)算取值,構(gòu)造初始學(xué)習(xí)樣本集合,建立核嶺回歸模型并求解得到預(yù)測(cè)器,利用低秩矩陣校正技術(shù)和Sherman?Morrison?Woodbury公式更新核嶺回歸模型得到在線預(yù)測(cè)器,進(jìn)而實(shí)現(xiàn)對(duì)數(shù)據(jù)流的在線預(yù)測(cè)。該方法采用固定預(yù)算策略,能有效控制在線學(xué)習(xí)模型的規(guī)模、節(jié)約存儲(chǔ)空間、有效降低計(jì)算復(fù)雜度、易于實(shí)現(xiàn)。本發(fā)明在線學(xué)習(xí)方法,能夠靈活處理具有數(shù)據(jù)流特征的在線預(yù)測(cè)問題,數(shù)據(jù)可以通過數(shù)據(jù)塊的形式收集,與傳統(tǒng)批處理方式以及當(dāng)前的在線學(xué)習(xí)方法相比,大幅度降低了計(jì)算復(fù)雜度和模型運(yùn)行時(shí)間,能夠高效處理回歸和分類問題。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)領(lǐng)域,涉及數(shù)據(jù)挖掘和數(shù)據(jù)處理的方法,具體地說,涉及一種基于固定預(yù)算的核嶺回歸在線學(xué)習(xí)方法。
背景技術(shù)
嶺回歸通過放棄回歸系數(shù)估計(jì)的無偏性,以損失部分信息、降低精度為代價(jià)獲得更穩(wěn)健的回歸系數(shù)估計(jì),在病態(tài)數(shù)據(jù)上的擬合效果優(yōu)于最小二乘法。而融合了核技巧的核嶺回歸可有效處理非線性問題因而得到了更為廣泛的應(yīng)用。傳統(tǒng)核嶺回歸模型的求解是基于批處理算法執(zhí)行的,算法的計(jì)算復(fù)雜度為O(n3),其中n為樣本數(shù)。然而,越來越多的實(shí)際問題所處理的數(shù)據(jù)具有數(shù)據(jù)流特性,如動(dòng)態(tài)工業(yè)生產(chǎn)過程優(yōu)化、傳感器實(shí)時(shí)監(jiān)測(cè)等,其采樣數(shù)據(jù)均是以數(shù)據(jù)流的形式隨時(shí)間推移不斷采集的。批處理算法由于計(jì)算復(fù)雜度高,不適合處理上述數(shù)據(jù)流問題。為此,國內(nèi)外學(xué)者們開始研究核嶺回歸的在線學(xué)習(xí)算法,以降低計(jì)算復(fù)雜度,減少模型運(yùn)行時(shí)間,標(biāo)志性成果是B.W.Chen提出的增量式核嶺回歸在線學(xué)習(xí)方法。該方法利用 Sherman-Morrison-Woodbury公式迭代更新核嶺回歸模型,將每次模型更新的計(jì)算復(fù)雜度由 O(n3)降到O(n2)。由于樣本量隨時(shí)間線性增長,核嶺回歸模型的規(guī)模、存儲(chǔ)空間、運(yùn)行時(shí)間都將隨之不斷增加。為解決上述問題,亟待開發(fā)一種基于固定預(yù)算學(xué)習(xí)樣本集的核嶺回歸在線學(xué)習(xí)方法,在保證模型精度的同時(shí)有效控制模型的存儲(chǔ)空間和學(xué)習(xí)時(shí)間,以適應(yīng)數(shù)據(jù)流環(huán)境。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)現(xiàn)有核嶺回歸在線學(xué)習(xí)方法無法有效控制模型規(guī)模等不足,提出了一種基于固定預(yù)算的核嶺回歸在線學(xué)習(xí)方法,該方法能夠降低模型存儲(chǔ)空間,減少運(yùn)行時(shí)間,滿足應(yīng)用問題的實(shí)時(shí)性需求。
根據(jù)本發(fā)明實(shí)施例,提出了一種基于固定預(yù)算學(xué)習(xí)樣本集的核嶺回歸在線學(xué)習(xí)方法,含有以下步驟:
(一)通過數(shù)值實(shí)驗(yàn)確定預(yù)算取值;
(二)按照預(yù)算隨機(jī)選取初始學(xué)習(xí)樣本構(gòu)造初始學(xué)習(xí)樣本集合,建立嶺回歸模型,通過中心化方法將嶺回歸模型轉(zhuǎn)化為無截距的嶺回歸模型并得到嶺回歸解,引入核技巧將嶺回歸預(yù)測(cè)器等價(jià)轉(zhuǎn)化為核嶺回歸預(yù)測(cè)器;
(三)以mini-batch或one-by-one的形式采集數(shù)據(jù)流,采用預(yù)測(cè)器對(duì)數(shù)據(jù)流中的樣本進(jìn)行預(yù)測(cè);
(四)采用3σ法則剔除數(shù)據(jù)流中的噪聲,以保持預(yù)測(cè)器的穩(wěn)定性;
(五)根據(jù)樣本貢獻(xiàn)值將部分樣本加入學(xué)習(xí)樣本集合,并按照最小貢獻(xiàn)準(zhǔn)則剔除相應(yīng)數(shù)量的樣本,維持預(yù)算穩(wěn)定;
(六)利用低秩矩陣校正技術(shù)以及Sherman-Morrison-Woodbury公式更新核嶺回歸模型,得到在線預(yù)測(cè)器,通過在線預(yù)測(cè)器對(duì)數(shù)據(jù)流進(jìn)行在線預(yù)測(cè)。
在根據(jù)本發(fā)明實(shí)施例的學(xué)習(xí)方法中,步驟(一)中,確定預(yù)算的具體步驟為:
(1)確定訓(xùn)練樣本集合和測(cè)試樣本集合。
(2)依次選取待測(cè)預(yù)算值,按照待測(cè)預(yù)算值在訓(xùn)練樣本集合中隨機(jī)選取相應(yīng)數(shù)目的樣本,建立核嶺回歸模型,并應(yīng)用測(cè)試樣本集合測(cè)試該預(yù)算值的精度。
(3)執(zhí)行步驟(2)10次,并計(jì)算各個(gè)預(yù)算的平均測(cè)試精度及平均測(cè)試時(shí)間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國石油大學(xué)(華東),未經(jīng)中國石油大學(xué)(華東)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810593893.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種基于在線學(xué)習(xí)隨機(jī)蕨分類器的行人檢測(cè)方法
- 一種交互式IT技能在線教育方法
- 一種基于網(wǎng)絡(luò)的在線學(xué)習(xí)評(píng)估系統(tǒng)
- 基于數(shù)據(jù)的在線學(xué)習(xí)全過程動(dòng)態(tài)分析方法及系統(tǒng)
- 一種情景式英語學(xué)習(xí)系統(tǒng)
- 遠(yuǎn)程學(xué)習(xí)轉(zhuǎn)化系統(tǒng)
- 一種基于web在線學(xué)習(xí)的資源訪問平臺(tái)
- 一種在線學(xué)習(xí)系統(tǒng)
- 在線學(xué)習(xí)挖掘方法及在線學(xué)習(xí)系統(tǒng)
- 一種在線學(xué)習(xí)者情緒識(shí)別方法
- 基于beta噪聲核嶺回歸技術(shù)的短期風(fēng)速預(yù)報(bào)方法
- 一種永磁同步直線電機(jī)弦截法內(nèi)模位置控制方法
- 一種永磁同步直線電機(jī)牛頓法內(nèi)模速度控制方法
- 多通道核相關(guān)濾波的實(shí)時(shí)跟蹤方法
- 基于G-L混合噪聲特性核嶺回歸技術(shù)的風(fēng)速預(yù)報(bào)方法及裝置
- 一種有刷直流電機(jī)核嶺分類速度測(cè)量方法
- 一種基于核嶺回歸的谷氨酸發(fā)酵過程軟測(cè)量建模方法
- 基于固定預(yù)算的核嶺回歸在線學(xué)習(xí)方法
- 適用于移動(dòng)機(jī)器人行人跟隨的核相關(guān)濾波目標(biāo)跟蹤方法
- 基于分布并行局部建模機(jī)制的嶺回歸軟測(cè)量建模方法
- 一種應(yīng)用于話務(wù)量預(yù)測(cè)的分段在線支持向量回歸方法
- 時(shí)間序列預(yù)測(cè)與智能控制結(jié)合的參數(shù)在線整定方法與系統(tǒng)
- 針對(duì)在線系統(tǒng)中的用戶動(dòng)作的定制化預(yù)測(cè)器
- 一種變壓器狀態(tài)參量趨勢(shì)預(yù)測(cè)方法及系統(tǒng)
- 一種基于LSSVM的在線NOx預(yù)測(cè)方法
- 一種基于周期性特征分析的在線負(fù)載資源預(yù)測(cè)方法
- 一種在線預(yù)測(cè)方法、系統(tǒng)及服務(wù)器
- 在線預(yù)警和離線診斷的“預(yù)測(cè)-驗(yàn)證-反饋-優(yōu)化”閉環(huán)系統(tǒng)
- 火電廠煙氣含氧量在線預(yù)測(cè)系統(tǒng)及其預(yù)測(cè)方法
- 一種在線學(xué)習(xí)的自適應(yīng)流量負(fù)載均衡方法
- 基于時(shí)間復(fù)雜度和空間復(fù)雜度來確定編碼模式的方法及裝置
- 一種視頻編碼復(fù)雜度自適應(yīng)調(diào)整方法及裝置
- 自適應(yīng)解碼復(fù)雜度的編碼方法、裝置、編解碼系統(tǒng)和設(shè)備
- 一種圖像組成復(fù)雜度計(jì)算方法
- 復(fù)雜度和碼率的確定方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種軟件復(fù)雜度計(jì)算方法
- 一種軟件復(fù)雜度計(jì)算系統(tǒng)
- 由計(jì)算界面認(rèn)知復(fù)雜度的信息交互界面優(yōu)化方法
- 一種指引二進(jìn)制漏洞挖掘路徑的方法及其應(yīng)用
- 一種用于對(duì)停車場(chǎng)環(huán)境駕駛場(chǎng)景復(fù)雜度評(píng)級(jí)的方法





