[發明專利]一種基于互聯網數據采集的情緒指數構建方法在審
| 申請號: | 201611030961.2 | 申請日: | 2016-11-16 |
| 公開(公告)號: | CN106780036A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 都科 | 申請(專利權)人: | 碩橙(廈門)科技有限公司 |
| 主分類號: | G06Q40/06 | 分類號: | G06Q40/06;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 361000 福建省廈門市集美*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 互聯網 數據 采集 情緒 指數 構建 方法 | ||
技術領域
本發明屬于數據分析技術領域,特別涉及一種關于股票價格預測的情緒指數構建方法。
背景技術
近年來,金融學界大量學術研究發現非標準化的數據,例如通過特殊方法構建的投資者關于市場的情緒波動指數、關于監管層面政策不確定性的相關指數,以及投資者在網絡上發表的關于投資的正負面言論等,對于解釋和分析金融市場波動起到了關鍵性的作用。因此,區別于目前通用的例如股票開盤價、收盤價、交易量等標準化金融數據,可通過構建市場投資者的情緒指數,來對股票價格日常走勢進行預測。
發明內容
本發明的目的,在于提供一種基于互聯網數據采集的情緒指數構建方法,其可通過IT技術獲取市場投資者的情緒指數,對金融市場中的投資決策提供重要的附加信息。
為了達成上述目的,本發明的解決方案是:
一種基于互聯網數據采集的情緒指數構建方法,包括如下步驟:
步驟1,獲取互聯網數據中針對某項投資的關注程度;
步驟2,構建正負情緒指標;
步驟3,從公開市場獲取當月IPO數量和當日股票價格波動兩項指標;
步驟4,根據如下公式計算市場投資者情緒指數:
市場投資者情緒指數=[A/(A+B+C+D)]*關注程度(Focus)+[B/(A+B+C+D)]*正負情緒指標(PosNegSentiment)+[C/(A+B+C+D)]*當月IPO數量(IPOnum)+[D/(A+B+C+D)]*當日股票價格波動(Volatility)
其中,A,B,C,D分別為關注程度、正負情緒指標、當月IPO數量、當日股票價格波動的權重。
上述步驟1的詳細內容是:根據上市公司總部所在地對應的IP所發表的關鍵字進行檢索,針對某項投資,以固定時間段為單位收集相關指數,來作為關注程度,所述相關指數是指在固定時間段內關鍵字出現次數的總和。
上述固定時間段為每月、每周、每天、每小時或每分鐘。
上述步驟2的詳細內容是:
步驟21,采用ORACLE關系型數據庫,包括表guba,表authors,表articles和表comments,通過如下步驟構建數據庫:
1)發送HTTP請求至股吧主頁URL,獲取HTML內容并解析,記錄page=1;
2)查找新標簽,遍歷子節點;
i.將帖子的標題、作者、股吧賬號、發表日期、最后更新日期存入表articles;
ii.訪問帖子URL,獲取細覽頁HTML內容并解析,將內容、閱讀數、評論數存入表comments;
iii.訪問作者URL,獲取作者頁HTML內容并解析,將作者信息存入表authors;
iv.訪問帖子股吧URL,將股吧信息存入表guba;
3)獲取帖子總數和每頁帖子數,判斷當前是否為最后一頁,如果不是最后一頁,則訪問下一頁,記錄page=page+1,重復步驟2);
步驟22,基于網頁得到的語義數據,通過語義分析領域通用的中文情感極性詞詞典使用SOSA算法進行分析,SOSA算法持續多次隨機輪詢節點,并根據以上方式進行狀態改變;然后,逐漸將溫度下降,重復下一輪操作;
步驟23,當輪詢次數達到預設,或滿足停止準則時,結束重復過程,以當前結果作為正負情緒指標。
上述步驟4中,權重的計算方法是:查詢股票實時收益,同時將步驟1-3得到的關注程度、正負情緒指標、當月IPO數量、當日股票價格波動代入下式,
股票實時收益=A*關注程度+B*正負情緒指標+C*當月IPO數量+D*當日股票價格波動+殘差
假設殘差符合正態分布,應用多元線性回歸得出A,B,C,D的值。
采用上述方案后,本發明利用非標準化數據對金融領域的影響,將非標準的網絡情緒數據和標準的金融數據有機結合,構成一套非標準化的、能夠準確衡量市場投機情緒的指數,基金經理,風控經理以及廣大投資者可以依據此信息調整投資策略,規避市場風險。
具體實施方式
以下將結合具體實施例,對本發明的技術方案及有益效果進行詳細說明。
本發明提供一種基于互聯網數據采集的情緒指數構建方法,可通過設計相應的指數,通過IT技術從網絡上合法獲取計算該指數所需要的相關信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于碩橙(廈門)科技有限公司,未經碩橙(廈門)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611030961.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:單邊賬規??刂品椒跋到y
- 下一篇:提示方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





