[發(fā)明專利]基于特征參數(shù)選取與LSTM模型的股指預(yù)測方法在審
| 申請?zhí)枺?/td> | 201711155418.X | 申請日: | 2017-11-20 |
| 公開(公告)號: | CN107844865A | 公開(公告)日: | 2018-03-27 |
| 發(fā)明(設(shè)計)人: | 陳佳;張傳雷;李建榮;于洋;武大碩 | 申請(專利權(quán))人: | 天津科技大學(xué) |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/06 |
| 代理公司: | 天津盛理知識產(chǎn)權(quán)代理有限公司12209 | 代理人: | 王利文 |
| 地址: | 300222 天津市河*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 特征 參數(shù) 選取 lstm 模型 股指 預(yù)測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及金融股票預(yù)測技術(shù),尤其是一種基于特征參數(shù)選取與LSTM模型的股指預(yù)測方法。
背景技術(shù)
股票市場作為風(fēng)險和投資雙高的投資市場,對其進行預(yù)測從而更好地進行選股和擇時以獲得最大收益是研究者密切關(guān)注的領(lǐng)域。沿用至今的分析方法可以分為兩類——基本面分析法與技術(shù)分析法?;久娣治龇ㄖ贮c在于國家經(jīng)濟政策與公司的基本面等信息,而技術(shù)分析方法則側(cè)重利用歷史數(shù)據(jù)帶入數(shù)學(xué)模型或機器中來訓(xùn)練和演算。其中,基本面分析法中應(yīng)用到的國家宏觀經(jīng)濟狀況、企業(yè)盈利狀況等因素均較難定量,且大多屬于長期性因素,所以如果只應(yīng)用基本面分析法預(yù)測的精度將很不準(zhǔn)確。而技術(shù)分析法主要是應(yīng)用客觀的量化指標(biāo)進行預(yù)測,較為常用的方法包括時間序列法、小波分析法、神經(jīng)網(wǎng)絡(luò)法等,但由于股市的限制以及股票自身的特性,當(dāng)前諸多方法并不能在預(yù)測時達到較好的效果,比如時間序列預(yù)測方法在處理非線性特征數(shù)據(jù)時并不能得以很好的應(yīng)用,而神經(jīng)網(wǎng)絡(luò)當(dāng)前較為流行的SVM預(yù)測模型只對求解小樣本、非線性問題具有優(yōu)秀的泛化能力。
此外,在預(yù)測過程中學(xué)者們往往較為重視模型的構(gòu)建,試圖通過數(shù)據(jù)預(yù)處理、優(yōu)化參數(shù)、結(jié)合多種網(wǎng)絡(luò)結(jié)構(gòu)等方法提升模型的擬合效果,卻忽略了股票影響因素這一重要方面。在以往的方法中我們發(fā)現(xiàn)預(yù)測股票價格指數(shù)的模型所應(yīng)用的輸入特征參數(shù)大多為最高價、平均價等一次性指標(biāo),且均為主觀選擇輸入。然而,由于股票本身受多種因素影響,各因素之間并不呈明顯線性關(guān)系,如果我們選擇的輸入特征參數(shù)較為單一,將不能很好地對這一預(yù)測問題予以反映;如果選擇的輸入特征參數(shù)較多,將會復(fù)雜化模型,不利于其訓(xùn)練速度及性能。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提出一種基于特征參數(shù)選取與LSTM模型的股指預(yù)測方法,解決股指預(yù)測精度和準(zhǔn)確度的問題。
本發(fā)明解決其技術(shù)問題是采取以下技術(shù)方案實現(xiàn)的:
一種基于特征參數(shù)選取與LSTM模型的股指預(yù)測方法,包括以下步驟:
步驟1、獲取股指數(shù)據(jù),全面選取特征參數(shù);
步驟2、采用系統(tǒng)聚類法進行特征分類,使得同一類中的參數(shù)相似度較高,不同類別之間的相似度則較低;
步驟3、采用主成分析法對不同類別參數(shù)進行降維,使新的指標(biāo)能夠保留原始信息且彼此之間互不相關(guān);
步驟4:將最終輸入特征參數(shù)直接輸入LSTM模型中進行訓(xùn)練,并對實驗結(jié)果進行分析。
進一步,所述步驟1全面選取特征參數(shù)時,需要考慮股票的影響因素,股票的影響因素包括宏觀因素、利率因素和估值因素。
進一步,所述步驟2系統(tǒng)聚類法包括以下步驟:
⑴將每個樣本看做一類,并計算各類之間的距離;
⑵將距離最近的兩類進行合并,成為新類別,并計算新類別與其他各類之間的距離;
⑶重復(fù)步驟⑵,直至所有類別聚為一類或達到所需的聚類數(shù)目。
進一步,所述步驟2采用系統(tǒng)聚類法將最終分類結(jié)果分為4類。
進一步,所述步驟3主成分分析法包括以下步驟:
⑴獲得數(shù)據(jù),計算數(shù)據(jù)的平均值;
⑵計算數(shù)據(jù)的協(xié)方差矩陣,并求得該協(xié)方差矩陣的特征值和特征向量;
⑶對特征值進行排序,篩選大于閾值的特征值,計算白化矩陣;
⑷計算累積貢獻率,提取主成分;
⑸計算主成分載荷,分析其與原數(shù)據(jù)的相關(guān)連續(xù)度。
進一步,所述步驟4采用的LSTM模型為LSTM神經(jīng)網(wǎng)絡(luò)模型,該LSTM神經(jīng)網(wǎng)絡(luò)模型由LSTM層和DENSE層構(gòu)成,使用的激活函數(shù)為tanh函數(shù)。
本發(fā)明的優(yōu)點和積極效果是:
1、本發(fā)明設(shè)計合理,其從優(yōu)化特征參數(shù)選取角度對模型預(yù)測能力進行提升并應(yīng)用LSTM模型進行訓(xùn)練,不僅計算量小,而且預(yù)測結(jié)果在速度和準(zhǔn)確度兩方面均有顯著提升。
2、本發(fā)明在模型選擇方面,采用深度學(xué)習(xí)相關(guān)方法可以從原始數(shù)據(jù)提取到更加抽象和更有代表性的特征,能更好地用于分類和預(yù)測,對于深度學(xué)習(xí)不容易訓(xùn)練的問題,可以采用逐層訓(xùn)練的方法予以解決,所以選取合適的深度學(xué)習(xí)往往會使得預(yù)測的效果有時更加理想;采用新型深度學(xué)習(xí)算法,能夠憑借其時序與定向循環(huán)的優(yōu)勢特性,更適合分析時間序列前后之間相互關(guān)聯(lián)的預(yù)測問題。
3、本發(fā)明在特征參數(shù)選取方面,由于股票受不同因素影響的不確定性,因此選擇特征抽取的方法進行降維,包含全面選取特征參數(shù)、應(yīng)用系統(tǒng)聚類法進行特征分類、應(yīng)用主成分分析對分類特征進行降維三個步驟,通過此方法對輸入特征參數(shù)進行整合和優(yōu)化。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津科技大學(xué),未經(jīng)天津科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711155418.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種1Hz起振振動設(shè)備
- 下一篇:制備三甲基金屬化合物的方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





