[發明專利]一種基于新聞大數據的自動選股方法在審
| 申請號: | 201710076418.4 | 申請日: | 2017-02-13 |
| 公開(公告)號: | CN107025264A | 公開(公告)日: | 2017-08-08 |
| 發明(設計)人: | 張鐵軍 | 申請(專利權)人: | 閩南師范大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27;G06Q40/04 |
| 代理公司: | 北京輕創知識產權代理有限公司11212 | 代理人: | 王新生 |
| 地址: | 363000 *** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 新聞 數據 自動 方法 | ||
技術領域
本發明涉及信息檢索領域,具體地講就是一種基于新聞大數據的自動選股方法。
背景技術
現在,量化投資在管理資產中起到越來越重要的作用,大家開始利用計算機設備對歷史股票量價數據作為數據資源,通過數學模型進行驗證,用于對股票進行量化投資。現有方案關注個股特點分析,沒有從行業關注度角度進行自動選股。由于新聞導向同時也會對股票數據的走向具有一定的預警作用(“本發明采用詞匯統計分析法挖掘新聞的情感傾向,完成自動選股”)。簡單地說,新聞內容的情感傾向可分為兩種情形:正面情感和負面情感,正面情感采用新聞內容中的正面情感詞匯比率表示,負面情感采用新聞內容中的負面詞匯比率表示。如何利用新聞內容體現出的情感傾向,使其服務于量化投資,是本發明要解決的技術問題。
發明內容
本發明的目的是提供一種基于新聞大數據的自動選股方法,首先將情感詞匯和行業詞匯存入存儲器,上述情感詞匯以及行業詞匯來源于專業漢語財經詞典;通過RSS實時獲取互聯網財經新聞,每小時更新一次;將當天的新聞內容通過服務器解析分析當天的新聞內容,新聞內容分析包括兩個子部分,1)新聞內容的情感維度分析,計算得到新聞內容的情感傾向;2)新聞內容的行業維度分析,計算得到新聞內容體現的行業關注度;利用情感傾向、行業關注度計算股票排名,選擇排名靠前的股票作為投資對象。
將新聞內容解析為詞匯的集合,即 ,t代表詞匯總數目),其中包括r個正面情感詞匯,s個負面情感詞匯,第i天內,正面詞匯比率為,該比率代表新聞的正面情感;負面詞匯比率為,該比率代表新聞的負面情感;
第i天內,行業x的關注度為,計算方法為 ,其中,y代表新聞內容中行業x相關詞匯數目,t為總詞匯數目;
在第i天內,設定行業x的正面關注度為 ,= ×;設定行業x的負面關注度為,= × ;
在過去一個月內,設定行業x的累計熱度(關注度)為 ,= ,其中{i=1,…,m},m為當月的天數;
每個月的最后一個天晚23:00后,計算本月所有行業的月累計熱度,其中{x=1,…, 24},共24個行業;依據{x=1,…, 24}的數值從高到低,完成24個行業的排序;本方法選擇排名第一的行業的全部公司股票作為下一個月的投資對象。
本發明的理論基礎是基于以下分析:情感詞匯具有心理學意義,正面詞匯代表了積極心理暗示;負面詞匯代表了人類消極心理暗示;例如,“漲停、良好、豐收”等詞匯體現了新聞內容中的積極態度,而“跌停、疲軟、萎靡”等詞匯體現了新聞內容中的消極態度。當新聞中負面詞匯比率增大時,市場展現了悲觀消極的預期,股市下行風險增大。行業詞匯具有較強的行業指向性,例如,“不良貸款”主要指向銀行業的上市公司,“乘用車”主要指向汽車行業的上市公司。當新聞中某種行業詞匯的比率增加時,市場熱點轉向該行業,該行業的上市公司將會受到更多的投資者關注。
本發明通過新聞大數據的情感維度、行業維度選股;現有方案關注個股特點分析,沒有從行業熱度角度進行自動選股。本方案通過詞匯關聯確認新聞內容體現的情感傾向和行業關注度,是對現有技術中的創新。新聞大數據自動選股優點:1)新聞情感(正負面情感強度)與股市、上市公司之間聯動關系的理論基礎已經得到廣泛證實。2)自動提取情感傾向與行業關注度,全自動排名篩選股票。
附圖說明
圖1是本發明的流程圖。
圖2是本發明執行算法的流程圖。
具體實施方式
下面,結合本發明的主要流程以及執行算法流程圖,對本發明作進一步詳細說明。
關鍵詞:情感詞匯表,行業詞匯表。情感詞匯指的是情感詞匯列表中的詞匯,包括正面詞匯和負面詞匯兩個部分。行業詞匯表針對每個行業的常見關鍵詞進行匯編后得到的詞匯表。上述情感詞匯表和行業詞匯表來源于《專業漢語財經詞典》,申請人已編纂成冊。
舉例來說,正面詞匯包含:成功、出色、得天獨厚、引領、進步、創新等。負面詞匯包括失敗、損失、不足、差評、召回、低迷等。
行業詞匯,舉例來說,銀行業中,常見的關鍵詞為利息、貸款、銀監會、央行、利率、信貸等。房地產行業中,常見的關鍵詞置業、首套房、住宅、地塊、商品房、樓市等。
行業公司,是指銀行業的代表公司為民生銀行、招商銀行、南京銀行、平安銀行等。房地產行業的代表企業為萬科A、保利地產、華夏幸福、碧桂園等。
本過程通過RSS監控公開新聞源獲得,例如,人民網RSS,新華網RSS等。為了保障實時性,本方法每個小時對新聞更新一次。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于閩南師范大學,未經閩南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710076418.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:酒瓶(福字扁壺)
- 下一篇:搜索方法、裝置、系統、以及命令轉換器的生成方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





