[發(fā)明專(zhuān)利]一種基于社會(huì)媒體的宏觀經(jīng)濟(jì)領(lǐng)域情感分析方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201711248804.3 | 申請(qǐng)日: | 2017-12-01 |
| 公開(kāi)(公告)號(hào): | CN107885883A | 公開(kāi)(公告)日: | 2018-04-06 |
| 發(fā)明(設(shè)計(jì))人: | 付博 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京國(guó)信宏數(shù)科技有限公司 |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 北京恒都律師事務(wù)所11395 | 代理人: | 王清亮 |
| 地址: | 100080 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 社會(huì) 媒體 宏觀經(jīng)濟(jì) 領(lǐng)域 情感 分析 方法 系統(tǒng) | ||
1.一種基于社會(huì)媒體的宏觀經(jīng)濟(jì)領(lǐng)域情感分析方法,其特征在于,所述方法包括:
通過(guò)數(shù)據(jù)模塊抓取經(jīng)濟(jì)領(lǐng)域的社會(huì)媒體數(shù)據(jù),并對(duì)所述社會(huì)媒體數(shù)據(jù)進(jìn)行預(yù)處理;
通過(guò)分類(lèi)特征模塊定義社會(huì)媒體數(shù)據(jù)的分類(lèi)特征;
根據(jù)所述分類(lèi)特征通過(guò)分類(lèi)器模型訓(xùn)練模塊構(gòu)建分類(lèi)器模型,并對(duì)所述分類(lèi)器模型進(jìn)行訓(xùn)練學(xué)習(xí);
利用所述分類(lèi)器模型通過(guò)判定模塊對(duì)經(jīng)過(guò)預(yù)處理的所述社會(huì)媒體數(shù)據(jù)進(jìn)行情感判定。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過(guò)數(shù)據(jù)模塊抓取社會(huì)媒體數(shù)據(jù),并對(duì)所述社會(huì)媒體數(shù)據(jù)進(jìn)行預(yù)處理,具體包括:
從互聯(lián)網(wǎng)上抓取經(jīng)濟(jì)領(lǐng)域社會(huì)媒體數(shù)據(jù),將所述數(shù)據(jù)進(jìn)行去重和去噪預(yù)處理,劃分成多個(gè)情感句子。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述分類(lèi)特征包括詞匯特征、情感詞特征、表情符特征、情感上下文特征和符號(hào)特征。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,
所述詞匯特征,指通過(guò)分詞工具對(duì)句子進(jìn)行分詞后將句中出現(xiàn)的詞匯表示成詞向量形式,定義詞匯特征屬于布爾值特征;
所述情感詞特征,指將句子中出現(xiàn)的正面情感詞的個(gè)數(shù)、出現(xiàn)的情感詞的分值總和、出現(xiàn)的情感詞的最大情感值分值和最后一個(gè)情感詞的分值作為情感詞特征;
所述表情符特征,指收集帶有同類(lèi)表情符的社會(huì)媒體數(shù)據(jù),定義表情符極性規(guī)則,根據(jù)所述表情符極性規(guī)則獲得表情符情感詞典;
所述情感上下文特征,指對(duì)于含有多個(gè)分句以及分句中含有轉(zhuǎn)折詞語(yǔ)的情感句,整句的情感值為含有轉(zhuǎn)折詞語(yǔ)的轉(zhuǎn)折句的情感值;對(duì)于含有否定詞語(yǔ)的情感句,整句的情感值等于原情感值取反;
所述視覺(jué)特征,指通過(guò)視覺(jué)捕捉到的特征,包括延長(zhǎng)詞語(yǔ)、連續(xù)標(biāo)點(diǎn)符號(hào)、短鏈接、提及特征和話題;其中,所述延長(zhǎng)詞語(yǔ)指重復(fù)次數(shù)超過(guò)2次的詞語(yǔ)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,
所述情感詞的分值來(lái)源于情感詞典,所述情感詞典是指對(duì)經(jīng)濟(jì)領(lǐng)域的文本進(jìn)行情感標(biāo)注后統(tǒng)計(jì)正負(fù)面極性得出的情感詞典,所述情感詞典包括情感詞和所述情感詞的極性得分。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述表情符極性規(guī)則獲得表情符情感詞典,具體包括:
利用表情符獲取大量社會(huì)媒體數(shù)據(jù);
修正所述表情符,得出表情符數(shù)據(jù);
只收集帶有同類(lèi)表情符的社會(huì)媒體數(shù)據(jù),定義表情符極性規(guī)則為:包含正面表情符且不包含負(fù)面表情符的社會(huì)媒體數(shù)據(jù)具有正面情感極性,包含負(fù)面表情符且不包含正面表情符的社會(huì)媒體數(shù)據(jù)具有負(fù)面情感極性;
根據(jù)所述表情符極性規(guī)則進(jìn)行修正,獲得表情符情感詞典。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述分類(lèi)特征通過(guò)分類(lèi)器模型訓(xùn)練模塊構(gòu)建分類(lèi)器模型,對(duì)所述分類(lèi)器模型進(jìn)行訓(xùn)練學(xué)習(xí),具體包括:
將所述分類(lèi)特征加入到分類(lèi)器模型中,對(duì)所述分類(lèi)器模型進(jìn)行訓(xùn)練學(xué)習(xí);
所述訓(xùn)練學(xué)習(xí)采用的評(píng)價(jià)指標(biāo)為正確率、準(zhǔn)確率、召回率和F值,所述F值指正確率和召回率的調(diào)和平均值。
8.一種基于社會(huì)媒體的宏觀經(jīng)濟(jì)領(lǐng)域情感分析系統(tǒng),其特征在于,所述系統(tǒng)包括:
數(shù)據(jù)模塊,用于抓取經(jīng)濟(jì)領(lǐng)域的社會(huì)媒體數(shù)據(jù),并對(duì)所述社會(huì)媒體數(shù)據(jù)進(jìn)行預(yù)處理;
分類(lèi)特征模塊,用于定義社會(huì)媒體數(shù)據(jù)的分類(lèi)特征;
分類(lèi)器模型訓(xùn)練模塊,用于根據(jù)所述分類(lèi)特征構(gòu)建分類(lèi)器模型,對(duì)所述分類(lèi)器模型進(jìn)行訓(xùn)練學(xué)習(xí);
判定模塊,用于利用所述分類(lèi)器模型對(duì)經(jīng)過(guò)預(yù)處理的所述社會(huì)媒體數(shù)據(jù)進(jìn)行情感判定。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述分類(lèi)特征包括詞匯特征、情感詞特征、表情符特征、情感上下文特征和符號(hào)特征。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,
所述詞匯特征,指通過(guò)分詞工具對(duì)句子進(jìn)行分詞后將句中出現(xiàn)的詞匯表示成詞向量形式,定義詞匯特征屬于布爾值特征;
所述情感詞特征,指將句子中出現(xiàn)的正面情感詞的個(gè)數(shù)、出現(xiàn)的情感詞的分值總和、出現(xiàn)的情感詞的最大情感值分值和最后一個(gè)情感詞的分值作為情感詞特征;
所述表情符特征,指收集帶有同類(lèi)表情符的社會(huì)媒體數(shù)據(jù),定義表情符極性規(guī)則,根據(jù)所述表情符極性規(guī)則獲得表情符情感詞典;
所述情感上下文特征,指對(duì)于含有多個(gè)分句以及分句中含有轉(zhuǎn)折詞語(yǔ)的情感句,整句的情感值為含有轉(zhuǎn)折詞語(yǔ)的轉(zhuǎn)折句的情感值;對(duì)于含有否定詞語(yǔ)的情感句,整句的情感值等于原情感值取反;
所述視覺(jué)特征,指通過(guò)視覺(jué)捕捉到的特征,包括延長(zhǎng)詞語(yǔ)、連續(xù)標(biāo)點(diǎn)符號(hào)、短鏈接、提及特征和話題;其中,所述延長(zhǎng)詞語(yǔ)指重復(fù)次數(shù)超過(guò)2次的詞語(yǔ)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京國(guó)信宏數(shù)科技有限公司,未經(jīng)北京國(guó)信宏數(shù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711248804.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種區(qū)域宏觀經(jīng)濟(jì)預(yù)測(cè)模型方法
- 基于燈光遙感數(shù)據(jù)國(guó)家宏觀經(jīng)濟(jì)指標(biāo)估測(cè)方法
- 一種宏觀經(jīng)濟(jì)趨勢(shì)預(yù)估系統(tǒng)及方法
- 基于評(píng)估GDP增長(zhǎng)指標(biāo)的區(qū)域宏觀經(jīng)濟(jì)預(yù)測(cè)建模方法及應(yīng)用
- 一種基于互聯(lián)網(wǎng)大數(shù)據(jù)的宏觀經(jīng)濟(jì)分析方法及系統(tǒng)
- 宏觀經(jīng)濟(jì)預(yù)測(cè)方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)插值方法及裝置、可讀存儲(chǔ)介質(zhì)
- 一種基于互聯(lián)網(wǎng)大數(shù)據(jù)的宏觀經(jīng)濟(jì)分析方法及系統(tǒng)
- 一種基于大數(shù)據(jù)的經(jīng)濟(jì)趨勢(shì)分析系統(tǒng)
- 基于大數(shù)據(jù)的區(qū)域宏觀經(jīng)濟(jì)預(yù)測(cè)模型及方法





