[發明專利]一種基于投資者情緒測度的股市波動預測方法在審
| 申請號: | 202310211218.0 | 申請日: | 2023-03-07 |
| 公開(公告)號: | CN116523100A | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 李紹芳;任婷婷;劉曉星 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/04;G06Q10/0639;G06N3/04 |
| 代理公司: | 北京同輝知識產權代理事務所(普通合伙) 11357 | 代理人: | 楊敬 |
| 地址: | 210096 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 投資者 情緒 測度 股市 波動 預測 方法 | ||
1.一種基于投資者情緒測度的股市波動預測方法,其特征在于,包括以下步驟:
獲取股市交易指標以及利用網絡爬蟲技術獲取投資者的在線評論數據,并對其進行預處理;
基于獲取的預處理文本數據,對LM金融詞典、Vader情緒分類器、Word2vec和BERT詞向量進行定制,構建四種不同的投資者情緒指標SentiLM、SentiVader、SentiWord2vec和SentiBERT;
將獲取的投資者情緒指標與市場指標輸入MR、SVR、AdaBoost、RF和LSTM等多個算法中,并構建股市波動預測模型。
2.根據權利要求1所述的一種基于投資者情緒測度的股市波動預測方法,其特征在于,所述股市交易指標為日度數據,包括開盤價、收盤價、最高價、最低價和交易量。
所述投資者的在線評論數據包括投資者發表在線評論的時間和在線評論的文本,對獲取的投資者評論數據進行的預處理過程包括:過濾重復的數據;刪除表情、特殊字符、超鏈接、提及、標簽、引用、標點符號、數字、多余空格和停用詞;實現分詞,獲取語料庫與句向量集。
3.根據權利要求1所述的一種基于投資者情緒測度的股市波動預測方法,其特征在于,所述LM金融詞典的定制過程如下:
先選取傳統LM詞典中的積極和消極詞匯,然后基于所述的語料庫將詞典中出現頻次較少的詞匯進行低頻詞刪除,接著利用Word2vec技術得出詞匯的詞向量,并利用如下公式計算詞匯的相似性,進行所述詞典的高頻詞擴充,最后手動刪除不合適的詞匯,形成定制的LM金融詞典,詞匯相似性的計算如下式:
式中,A和B分別代表兩個詞匯所對應的詞向量。
4.根據權利要求1所述的一種基于投資者情緒測度的股市波動預測方法,其特征在于,根據所述LM金融詞典,統計每條評論中積極和消極詞匯出現的個數,并計算每條評論的投資者情緒得分,如下式:
式中,為每條評論中的積極詞匯個數,為每條評論中的消極詞匯個數,為每條評論的投資者情緒指標得分;
根據所述每條評論的投資者情緒得分,計算日度的投資者情緒指標SentiLM得分,如下式:
式中,為t天的投資者情緒得分,為t天內的第i條在線評論的情緒者情緒得分,n為t天內的投資者在線評論總數。
5.根據權利要求1所述的一種基于投資者情緒測度的股市波動預測方法,其特征在于,所述Vader情緒分類器的定制過程如下:
先選取傳統Vader情緒分類器中的正式詞匯,然后基于所述的語料庫將詞典中出現頻次較少的詞匯進行低頻詞刪除,接著利用Word2vec技術得出詞匯的詞向量,利用如下公式計算詞匯的相似性,進行所述詞典的高頻詞擴充,最后根據特定規則對擴充的詞匯進行情緒值權重的選取,并結合傳統Vader情緒分類器中的標點符號和縮略詞形成定制的Vader詞典,詞匯相似性的計算如下式:
式中,A和B分別代表兩個詞匯所對應的詞向量。
6.根據權利要求1所述的一種基于投資者情緒測度的股市波動預測方法,其特征在于,將傳統的Vader情緒分類器所使用的詞典更新為定制的所述Vader詞典,在計算出每條在線評論的投資者情緒得分后,計算日度的投資者情緒指標SentiVader得分,如下式;
式中,為t天的投資者情緒得分,為t天內的第i條在線評論的情緒者情緒得分,n為t天內的投資者在線評論總數。
7.根據權利要求1所述的一種基于投資者情緒測度的股市波動預測方法,其特征在于,所述投資者情緒指標SentiWord2vec的定制過程如下:
先根據所述句向量集采用Word2vec中的Skip-gram模型將詞匯轉換為對應的詞向量,然后對詞向量進行平均得到句向量,接著對句向量進行平均得到日度的投資者情緒指標SentiWord2vec。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310211218.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





