[發(fā)明專利]一種金融文本情感分析方法有效
| 申請?zhí)枺?/td> | 201510400569.1 | 申請日: | 2015-07-09 |
| 公開(公告)號: | CN105138506B | 公開(公告)日: | 2018-07-03 |
| 發(fā)明(設計)人: | 雷濤;邵明東;呂慧 | 申請(專利權)人: | 天云融創(chuàng)數(shù)據(jù)科技(北京)有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100025 北京市朝陽區(qū)東四環(huán)中路*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本情感 詞語 金融 情感模型 分詞 神經(jīng)元 神經(jīng)網(wǎng)絡計算 詞語文本 單獨概念 函數(shù)表達 函數(shù)計算 加權組合 情感詞典 情感環(huán)境 序列向量 輸出層 輸入層 隱藏層 乘法 詞性 分句 構建 加法 句子 兼容 分析 文本 修正 轉折 融合 | ||
1.一種金融文本情感分析方法,其特征在于包括如下步驟:
步驟(1)構建金融情感詞典:包括構建包含正面情感詞語的正面情感詞典和包含負面情感詞語的負面情感詞典,構建詞義情感需根據(jù)語言環(huán)境判定的不確定情感詞典,構建修飾程度詞語的程度詞典,構建具有否定含義的否定詞典,構建表示唯一的單獨概念詞典,構建轉折詞詞典,構建表示命令、指令或規(guī)范的規(guī)范詞詞典;
步驟(2)文本預處理:對金融文本分句,對句子分詞,生成包含詞語、詞性和詞語情感值的分詞序列向量;
步驟(3)乘法情感模型:用詞語情感值的乘法和句子情感值的加法組成的乘法情感模型計算整篇金融文本的情感值;
步驟(4)加法情感模型:以正面情感詞語和負面情感詞語數(shù)量表示為金融文本情感值的加法情感模型計算整篇金融文本的情感值;
步驟(5)融合情感值:用乘法情感模型和加法情感模型的加權組合計算融合的金融文本情感值;
步驟(6)金融文本情感值兼容表達:金融文本情感值表示為[0,2]的實數(shù),或表示為[-1,1]的實數(shù)。
2.根據(jù)權利要求1所述金融文本情感分析方法,其特征在于:所述步驟(2)文本預處理需要對每一個待處理的金融文本進行分句,并對每個句子進行分詞處理,生成包含詞語、詞性和詞語情感值的分詞序列向量,表示為一個三元組的序列。
3.根據(jù)權利要求1所述金融文本情感分析方法,其特征在于:所述步驟(3)乘法情感模型用情感詞語的情感值的乘積計算句子的情感值;計算步驟如下:
1)設定詞語的情感值,正面情感詞用大于1的數(shù);負面情感詞用小于1的數(shù);不確定情感詞用0.9~1.0的數(shù),如果不確定情感詞表示的負面情感較正面情感多,則不確定情感詞的情感值設為0.9,如果正面情感較負面情感多,則不確定情感詞的情感值設為1;
2)句子情感值的計算需要修正否定詞、程度副詞、單獨概念詞、轉折詞以及規(guī)范詞的影響;規(guī)則如下:
a.計算否定詞集;如果否定詞個數(shù)大于Nmin,Nmin表示否定詞個數(shù)下界,并且小于Nmax,Nmax表示否定詞個數(shù)上界,并且前兩個否定詞位置差大于Ndiff,Ndiff表示前兩個否定詞位置差的下界,并且第一個否定詞位置小于Nfirst,Nfirst表示第一個否定詞距當前詞語的位置上界;則當前詞語的情感值受否定詞影響,應將當前詞語的情感值反轉,即修正當前詞情感值=1÷原當前詞情感值;
b.如果否定詞個數(shù)等于Nmin,并且否定詞位置小于Nfirst,與當前詞之間沒有表唯一的詞語;則當前詞語的情感值受否定詞影響,應將當前詞語的情感值反轉,即修正當前詞情感值=1÷原當前詞情感值;
c.如果否定詞個數(shù)等于Nmin,并且否定詞位置小于Nfirst,與當前詞之間有表唯一的詞語;那么,如果不包含“沒有”開頭的否定詞,并且已計算的當前詞情感值大于1,則修正當前詞情感值=a×已計算的當前詞情感值,a>1.0;如果已計算的當前詞情感值小于1,則修正當前詞情感值=b×已計算的當前詞情感值,b<1.0;如果包含“沒有”開頭的否定詞,則當前詞語的情感值反轉,即修正當前詞情感值=1÷原當前詞情感值;
d.當前程度詞之前有負面情感詞:如果當前程度詞程度值大于1,則修改當前程度詞情感值為當前程度詞程度值的倒數(shù),否則修改當前程度詞情感值為當前程度詞程度值+0.05;
e.當前程度詞之前有正面情感詞:如果不是正面情感詞與當前程度詞之間有負面情感詞的情況,則修改當前程度詞情感值為當前程度詞程度值,否則為1;
f.當前詞之前至少有一個程度詞:最近的程度詞不是否定詞,距離當前詞小于等于2;最近程度詞不是情感詞或者是不確定情感詞并且前一次掃描不是步驟d或步驟e的情況,那么,如果最近程度詞程度值大于1并且當前詞情感值大于1,修正當前詞情感值=最近程度詞程度值×已計算當前詞情感值;如果最近程度詞程度值大于1并且當前詞情感值小于1,修正當前詞情感值=已計算當前詞情感值/最近程度詞程度值;如果最近程度詞程度值小于1并且當前詞情感值大于1,修正當前詞情感值=最近程度詞程度值*已計算當前詞情感值;如果最近程度詞程度值小于1并且當前詞情感值小于1,修正當前詞情感值=(最近程度詞程度值+0.1)×已計算當前詞情感值;如果最近程度詞程度值等于1或當前詞情感值等于1時,修正當前詞情感值=1;
g.修正有轉折詞修飾的情感詞的情感值:如果已計算句子情感值大于1,修正當前詞情感值=已計算當前詞情感值×Vn,Vn為單個負面情感詞語的情感值;如果已計算句子情感值小于1,修正當前詞情感值=已計算當前詞情感值×Vp,Vp為單個正面情感詞語的情感值;
h.修正連續(xù)兩個情感詞的短語情感值:前一個是正面情感詞,后一個是負面情感詞,當前詞情感值=已計算當前詞情感值×Vn,Vn為單個負面情感詞語的情感值;前一個是負面情感詞,后一個是正面情感詞,當前詞情感值=已計算當前詞情感值×Vp,Vp為單個正面情感詞語的情感值;
i.修正有規(guī)范詞修飾的情感詞的情感值:如果當前詞情感值大于Vpmax,Vpmax為單個規(guī)范詞的正面情感值最大閾值,當前詞情感值=已計算當前詞情感值×(2-Vpmax);如果當前詞情感值小于Vnmin,Vnmin為單個規(guī)范詞的負面情感值的最小閾值,當前詞情感值=已計算當前詞情感值÷Vnmin;
3)生成句子乘法情感值的情感產(chǎn)生函數(shù)為:
Vs=h(k·(Vp)α·(Vn)β·(Vu)γ)
式中,Vs是句子的乘法情感值,s∈[1,S],S是整篇金融文本中句子的條數(shù);k∈[0.9~1.1]是句子的情感系數(shù);Vp為單個正面情感詞語的情感值,α是正面情感詞語數(shù)目;Vn為單個負面情感詞語的情感值,β是負面情感詞語數(shù)目;Vu為不確定情感詞語的情感值,γ是不確定情感詞語數(shù)目;h(·)是句子情感限幅函數(shù),使情感值位于[0,2],如果x≤Vp,h(x)=x,如果x>Vp,h(x)=2/(1+e-λ(x-c)),其中,λ∈[0.5,2.0],c∈[0.5,1.5];
4)用句子的乘法情感值計算整篇文本的乘法情感值:
Ve=H(g((V1+V2+…+VS)/S))
式中,Ve是整篇金融文本的乘法情感值;S是整篇金融文本中句子的條數(shù);V1~VS是句子1~S的乘法情感值;g(x)=ew(x-θ)是情感轉換函數(shù);H(·)是整篇金融文本的情感限幅函數(shù),使情感值位于[0,2],如果x≤1.0,H(x)=x,如果x>1.0,H(x)=2/(1+e-w(x-θ)),其中w∈[1,5],θ∈[0,2];負面情感值為[0,1-ε),正面情感值為(1+ε,2],中性情感值為[1-ε,1+ε],1>ε>0;
5)文本的乘法情感值計算構成一個輸入層為詞語情感值的序列向量,隱藏層是情感產(chǎn)生函數(shù)為激活函數(shù)的句子情感層,輸出層為一個神經(jīng)元的神經(jīng)網(wǎng)絡;輸出層權系數(shù)為1/S,S是整篇金融文本中句子的條數(shù),或者根據(jù)句子的重要性設定輸出層權系數(shù),關鍵句的權系數(shù)較非關鍵句的權系數(shù)大,非關鍵句的權系數(shù)較關鍵句的權系數(shù)小。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天云融創(chuàng)數(shù)據(jù)科技(北京)有限公司,未經(jīng)天云融創(chuàng)數(shù)據(jù)科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510400569.1/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種采暖爐
- 下一篇:預制式搪瓷雙層保溫煙囪





