[發明專利]一種基于投資者情緒測度的股市波動預測方法在審
| 申請號: | 202310211218.0 | 申請日: | 2023-03-07 |
| 公開(公告)號: | CN116523100A | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 李紹芳;任婷婷;劉曉星 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/04;G06Q10/0639;G06N3/04 |
| 代理公司: | 北京同輝知識產權代理事務所(普通合伙) 11357 | 代理人: | 楊敬 |
| 地址: | 210096 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 投資者 情緒 測度 股市 波動 預測 方法 | ||
本發明公開了計算機領域的一種基于投資者情緒測度的股市波動預測方法,包括以下步驟:獲取股市交易指標以及利用網絡爬蟲技術獲取投資者的在線評論數據,并對其進行預處理;對LM金融詞典、Vader情緒分類器、Word2vec和BERT詞向量進行定制,構建四種不同的投資者情緒指標;將投資者情緒指標與市場指標輸入多個算法中,并構建股市波動預測模型。本發明方法通過網絡爬蟲技術獲取投資者針對股市的評論文本信息,從多個角度構建了投資者情緒指標,研究充分全面,與市場交易指標相結合,構建了股市波動預測模型;引入了多種測度投資者情緒的方法,在市場交易指標的基礎上添加了增量信息,有效地降低了模型在股市波動預測上的誤差,提高了預測精度。
技術領域
本發明屬于計算機領域,具體涉及一種基于投資者情緒測度的股市波動預測方法。
背景技術
股票市場的可預測性是金融研究中長期關注的焦點,也是一項富有挑戰性的工作。有效市場假說(EMH)認為過去和現在的信息會及時反映在股票價格中,在該環境下不存在任何套利機會。然而,隨著時間的推移,對EMH的挑戰越來越多,學者們也已經做出無數研究以證明股票市場的可預測性。此外,行為金融學理論認為股票市場是由投資者心理驅動的,這一觀點也被研究人員廣泛采納。
投資者情緒是指投資者對股市未來發展的投資意愿或預期,可以通過網絡評論、網絡新聞或圖片等多種渠道傳達,從而為股市發展趨勢、投資組合套利和資產定價提供重要的增量信息。此外,人工智能技術的發展為投資者情緒的有效度量提供了便利,也為后續的深入研究和應用奠定了基礎。傳統的經濟模型如自回歸(AR)和廣義自回歸條件異方差(GARCH),常常因其在時間序列數據上的優勢被應用在股市預測中。然而,機器學習算法的興起為該問題帶來了一絲曙光,盡管被詬病為“黑匣子”,但其特殊的模型結構可以從復雜的非線性金融數據中提取重要信息,從而比經典模型表現更好。
在利用將投資者情緒與機器學習算法相結合來預測股市波動的研究中,大多是直接使用通用詞典來衡量投資者情緒。然而通用詞典的有效性可能會在不同的應用場景下下降。此外科學技術的快速發展提供了多種測度投資者情緒的方法,從傳統的基于詞典的方法到流行的機器學習模型。然而很少有方法對多種投資者情緒指標在股市波動預測研究方面的性能表現進行對比分析。
發明內容
針對現有技術的不足,本發明的目的在于提供一種基于投資者情緒測度的股市波動預測方法,以解決上述背景技術中提出的問題。
本發明的目的可以通過以下技術方案實現:
一種基于投資者情緒測度的股市波動預測方法,包括以下步驟:
獲取股市交易指標以及利用網絡爬蟲技術獲取投資者的在線評論數據,并對其進行預處理;
基于獲取的預處理文本數據,對LM金融詞典、Vader情緒分類器、Word2vec和BERT詞向量進行定制,構建四種不同的投資者情緒指標SentiLM、SentiVader、SentiWord2vec和SentiBERT;
將獲取的投資者情緒指標與市場指標輸入MR、SVR、AdaBoost、RF和LSTM等多個算法中,并構建股市波動預測模型。
優選地,所述股市交易指標為日度數據,包括開盤價、收盤價、最高價、最低價和交易量。
所述投資者的在線評論數據包括投資者發表在線評論的時間和在線評論的文本,對獲取的投資者評論數據進行的預處理過程包括過濾重復的數據;刪除表情、特殊字符、超鏈接、提及、標簽、引用、標點符號、數字、多余空格和停用詞;實現分詞,獲取語料庫與句向量集。
優選地,所述LM金融詞典的定制過程如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310211218.0/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





