[發(fā)明專利]一種應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析方法與系統(tǒng)在審
| 申請?zhí)枺?/td> | 201710307190.5 | 申請日: | 2017-05-02 |
| 公開(公告)號: | CN107122351A | 公開(公告)日: | 2017-09-01 |
| 發(fā)明(設(shè)計)人: | 李青峰;朱留鋒;榮強;田淑寧;胡楚晗 | 申請(專利權(quán))人: | 燈塔財經(jīng)信息有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06K9/62 |
| 代理公司: | 深圳市六加知識產(chǎn)權(quán)代理有限公司44372 | 代理人: | 嚴(yán)泉玉 |
| 地址: | 430000 湖北省武漢市東西*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 應(yīng)用于 股票 新聞 領(lǐng)域 態(tài)度 傾向 分析 方法 系統(tǒng) | ||
1.一種應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析方法,其特征在于,所述方法包括:
根據(jù)股票新聞標(biāo)題的態(tài)度傾向?qū)傩越⒂晒善毙侣剺?biāo)題構(gòu)成的初始訓(xùn)練樣本集,所述態(tài)度傾向?qū)傩园ㄕ?、中性以及?fù)面,所述初始訓(xùn)練樣本集中包括正面、中性以及負(fù)面三個初始訓(xùn)練樣本子集;
對所述初始訓(xùn)練樣本集中的各股票新聞標(biāo)題進行預(yù)處理得到處理后訓(xùn)練樣本集,所述預(yù)處理包括分詞、數(shù)字化以及向量補齊,所述處理后訓(xùn)練樣本集包括具有相同維度的用于表示各股票新聞標(biāo)題的數(shù)字向量;
建立一個由輸入層、中間層以及輸出層構(gòu)成的多層LSTM神經(jīng)網(wǎng)絡(luò),利用處理后訓(xùn)練樣本集對所述神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,得到訓(xùn)練后神經(jīng)網(wǎng)絡(luò)模型;
利用所述訓(xùn)練后神經(jīng)網(wǎng)絡(luò)模型對待檢測股票新聞標(biāo)題進行態(tài)度傾向?qū)傩缘呐袆e,得到所述待檢測股票新聞標(biāo)題的態(tài)度傾向?qū)傩浴?/p>
2.如權(quán)利要求1所述的應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析方法,其特征在于,
所述多層LSTM神經(jīng)網(wǎng)絡(luò)的輸入層為特征表示層,用于將輸入的用于表示各股票新聞標(biāo)題的數(shù)字向量進一步表示為預(yù)設(shè)維度的特征向量;
所述多層LSTM神經(jīng)網(wǎng)絡(luò)的中間層為雙向LSTM層,由預(yù)設(shè)數(shù)量個LSTM單元組成,用于學(xué)習(xí)所述特征向量的語義特征,所述預(yù)設(shè)數(shù)量為所述預(yù)設(shè)維度的一半;
所述多層LSTM神經(jīng)網(wǎng)絡(luò)的輸出層為一個全連接層,使用sigmoid激活函數(shù),用于輸出一個浮點數(shù)值作為整個神經(jīng)網(wǎng)絡(luò)的輸出。
3.如權(quán)利要求1或2所述的應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析方法,其特征在于,所述預(yù)處理中的分詞、數(shù)字化以及向量補齊,具體為:
將股票新聞標(biāo)題進行分詞,得到M個詞語,所述M為該股票新聞標(biāo)題中詞語的數(shù)量;
將所述股票新聞標(biāo)題的每個詞語編碼成一個整數(shù),生成一個由整數(shù)編碼組成的M維向量;
將所述M維向量通過右側(cè)補零的方式生成具有相同長度的N維向量;所述N為預(yù)設(shè)值,且M<N。
4.如權(quán)利要求1或2所述的應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析方法,其特征在于,所述方法還包括錯誤樣本的處理和神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化,具體為:
如果利用所述訓(xùn)練后神經(jīng)網(wǎng)絡(luò)模型對待檢測股票新聞標(biāo)題進行態(tài)度傾向?qū)傩缘呐袆e結(jié)果有誤,則將判別有誤的待檢測股票新聞標(biāo)題標(biāo)記正確的態(tài)度傾向?qū)傩裕⒓尤胨龀跏加?xùn)練樣本集中,重新訓(xùn)練所述LSTM神經(jīng)網(wǎng)絡(luò)。
5.如權(quán)利要求1或2所述的應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析方法,其特征在于,所述初始訓(xùn)練樣本集中股票新聞標(biāo)題的態(tài)度傾向?qū)傩酝ㄟ^人工進行標(biāo)記。
6.如權(quán)利要求1或2所述的應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析方法,其特征在于,所述輸入層生成的特征向量的維度為128,所述中間層中LSTM單元的數(shù)量為64。
7.如權(quán)利要求1或2所述的應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析方法,其特征在于,所述正面、中性以及負(fù)面三個初始訓(xùn)練樣本子集中包含的股票新聞標(biāo)題的數(shù)量的差值小于預(yù)設(shè)值。
8.一種應(yīng)用于股票新聞領(lǐng)域的態(tài)度傾向分析系統(tǒng),其特征在于,包括初始訓(xùn)練樣本集生成模塊、訓(xùn)練樣本集預(yù)處理模塊、神經(jīng)網(wǎng)絡(luò)模塊訓(xùn)練模塊以及態(tài)度傾向?qū)傩耘袆e模塊,其中:
所述初始訓(xùn)練樣本集生成模塊,用于根據(jù)股票新聞標(biāo)題的態(tài)度傾向?qū)傩越⒂晒善毙侣剺?biāo)題構(gòu)成的初始訓(xùn)練樣本集,所述態(tài)度傾向?qū)傩园ㄕ?、中性以及?fù)面,所述初始訓(xùn)練樣本集中包括正面、中性以及負(fù)面三個初始訓(xùn)練樣本子集;
所述訓(xùn)練樣本集預(yù)處理模塊,用于對所述初始訓(xùn)練樣本集中的各股票新聞標(biāo)題進行預(yù)處理得到處理后訓(xùn)練樣本集,所述預(yù)處理包括分詞、數(shù)字化以及向量補齊,所述處理后訓(xùn)練樣本集包括具有相同維度的用于表示各股票新聞標(biāo)題的數(shù)字向量;
所述神經(jīng)網(wǎng)絡(luò)模塊訓(xùn)練模塊,用于建立一個由輸入層、中間層以及輸出層構(gòu)成的多層LSTM神經(jīng)網(wǎng)絡(luò),利用處理后訓(xùn)練樣本集對所述神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,得到訓(xùn)練后神經(jīng)網(wǎng)絡(luò)模型;
所述態(tài)度傾向?qū)傩耘袆e模塊,用于利用所述訓(xùn)練后神經(jīng)網(wǎng)絡(luò)模型對待檢測股票新聞標(biāo)題進行態(tài)度傾向?qū)傩缘呐袆e,得到所述待檢測股票新聞標(biāo)題的態(tài)度傾向?qū)傩浴?/p>
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于燈塔財經(jīng)信息有限公司,未經(jīng)燈塔財經(jīng)信息有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710307190.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





