[發明專利]一種基于RReliefF算法和支持向量回歸的趨勢預測方法在審
| 申請號: | 201910018145.7 | 申請日: | 2019-01-13 |
| 公開(公告)號: | CN109740683A | 公開(公告)日: | 2019-05-10 |
| 發明(設計)人: | 胡燕祝;王松 | 申請(專利權)人: | 胡燕祝 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 支持向量回歸 趨勢預測 算法 預測 特征屬性 多組數據 機器學習 類別樣本 輸入支持 數據挖掘 數值預測 算法選取 特征提取 特征向量 向量回歸 預測結果 質量估計 測試集 權值W 求解 樣本 更新 保證 | ||
本發明涉及基于RReliefF算法和支持向量回歸的趨勢預測方法屬于機器學習和數據挖掘領域,其特征在于采用如下步驟:(1)確定類別樣本I1,I2對特征屬性T的差異程度S;(2)更新質量估計權值W[T];(3)確定特征屬性T(t1,t2,...,ts);(4)訓練支持向量回歸模型,求解f(x);(5)將測試集樣本作為輸入,利用RReliefF算法選取特征向量并輸入支持向量回歸模型中進行預測,得到預測結果。本發明所建立的基于RReliefF算法和支持向量回歸的趨勢預測方法,用RReliefF算法進行特征提取,并將其作為支持向量回歸模型的輸入進行訓練,實現了數值預測。通過多組數據實驗結果可知,相比于其他模型相比,本發明訓練時間更短并且預測精度相對較高,為趨勢預測提供了在保證了預測精度的基礎上增加模型的訓練速度的預測方法。
技術領域
本發明涉及機器學習與數據挖掘領域,主要是一種數值趨勢預測方法。
背景技術
目前針對數值趨勢預測問題,大多數模型可以達到很高的預測精度,但是模型過于復雜導致訓練時間過長。有些模型雖然訓練數據較快,但是在模型訓練選取數據特征的時候,往往需要經過一些復雜的計算評估流程。在數值趨勢預測中,特征數量比較多,其中可能存在不相關的特征,特征之間也可能存在相關性,這容易導致“維度災難”,使其模型推廣能力下降,或者導致模型可能出現不適定的情況,即模型訓練得到的參數會因為樣本的微小變化而出現較大的波動,因此在特征選擇的過程中,大多數模型在特征選擇方面進行復雜化,這就導致模型訓練時間過長,復雜度升高,降低了模型效果。例如,利用遺傳算法進行特征選取的時候,首先需要隨機產生一批特征子集,并用評價函數給這些特征子集評分,然后通過交叉、突變等操作繁殖出下一代的特征子集,選取評分越高的特征子集參加繁殖。這樣經過N代的繁殖和優勝劣汰后,才能得到評價函數值最高的特征子集,這樣雖然可以達到較高的預測精度,但是算法流程過于復雜,在一定程度上降低了模型效率。
我國在數值預測方面也取得了一些豐富成果。例如,利用深度學習在電力負荷、交通流量、空氣質量等方面實現了較好的數值預測。隨著計算機互聯網的飛速發展以及海量數據的指數級增長,對模型的特征選擇以及預測速度提出了更高的要求。因此,要實現準確、高效地對某些領域的數值進行預測,達到數值預測的要求,必須建立一種簡單、高效的數值趨勢預測方法,進一步簡化模型的訓練流程,提高模型的運行速度,使得模型預測速度更快,為我國經濟和商業等領域提供一種精準、高效的數值趨勢預測方式,為未來的發展和管理提供指導性意見。
發明內容
針對上述現有技術中存在的問題,本發明要解決的技術問題是提供一種簡單、高效的數值趨勢預測方法,其具體流程如圖1所示。
技術方案實施步驟如下:
(1)確定類別樣本I1,I2對特征屬性T的差異程度S:
式中,value(T,I1)和value(T,I2)分別表示具有屬性值T的類別樣本I1,I2的判別值。
(2)更新質量估計權值W[T]:
其中,
PdifA=P(difvalue(A)|相近的樣本)
PdifC=P(difprediction|相近的樣本),
PdifC|difA=P((difprediction|difvalue(A))相近的樣本)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于胡燕祝,未經胡燕祝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910018145.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于域轉化和生成模型的圖像識別方法
- 下一篇:共享單車入欄檢測方法及裝置





