[發(fā)明專利]基于深度學(xué)習(xí)的主觀性文本情感分析方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710093687.1 | 申請(qǐng)日: | 2017-02-21 |
| 公開(公告)號(hào): | CN106776581B | 公開(公告)日: | 2020-01-24 |
| 發(fā)明(設(shè)計(jì))人: | 施寒瀟;厲小軍;陳南南 | 申請(qǐng)(專利權(quán))人: | 浙江工商大學(xué) |
| 主分類號(hào): | G06F40/289 | 分類號(hào): | G06F40/289;G06F40/30;G06F16/35 |
| 代理公司: | 33224 杭州天勤知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人: | 胡紅娟 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 學(xué)習(xí) 主觀性 文本 情感 分析 方法 | ||
本發(fā)明公開了一種基于深度學(xué)習(xí)的主觀性文本情感分析方法,包括:(1)在C&W模型的基礎(chǔ)上,構(gòu)建C&W?SP模型,將句子的情感標(biāo)簽與詞性標(biāo)簽標(biāo)注于句子內(nèi),構(gòu)建C&W_SPC&W?SP模型的訓(xùn)練集,并利用該訓(xùn)練集對(duì)C&W_SP模型進(jìn)行訓(xùn)練,得到訓(xùn)練集中每個(gè)詞的詞向量,組成詞向量文件;(2)根據(jù)獲得的詞向量文件,利用LSTM模型構(gòu)建句子向量集;(3)利用句子向量集對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到情感分類模型;(4)對(duì)測試評(píng)論語句進(jìn)行預(yù)處理,測試句子向量將測試句子向量輸入到情感分類模型中,計(jì)算得到此段評(píng)論的情感傾向。該方法情感傾向信息、詞性信息加入詞語中,提高了情感分析的準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體涉及的是一種基于深度學(xué)習(xí)的主觀性文本情感分析方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)的飛速發(fā)展,特別是Web2.0技術(shù)的逐漸普及,廣大網(wǎng)絡(luò)用戶已經(jīng)從過去單純的信息獲取者變?yōu)榫W(wǎng)絡(luò)內(nèi)容的主要制造者。中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的《第38次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》(CNNIC,2016)的數(shù)據(jù)顯示,截至2016年6月,我國網(wǎng)絡(luò)用戶總數(shù)量已經(jīng)達(dá)到7.10億,半年共計(jì)新增網(wǎng)民2132萬人,半年增長率為3.1%,互聯(lián)網(wǎng)普及率為51.7%。如此龐大且快速增長的網(wǎng)絡(luò)用戶群體加上Web2.0模式的互聯(lián)網(wǎng)應(yīng)用,使網(wǎng)絡(luò)內(nèi)容的數(shù)量和網(wǎng)絡(luò)信息的訪問量都以前所未有的速度增長,互聯(lián)網(wǎng)已經(jīng)成為人們表達(dá)觀點(diǎn)、獲取信息的重要途徑。當(dāng)前互聯(lián)網(wǎng)上的信息形式多種多樣,如新聞、博客文章、產(chǎn)品評(píng)論、論壇帖子等等。
近幾年,社會(huì)網(wǎng)絡(luò)(social network)應(yīng)用的推進(jìn)和用戶創(chuàng)造內(nèi)容(UGC)模式的興起,普通網(wǎng)民越來越成為信息內(nèi)容的重要生產(chǎn)者。以金融信息評(píng)論為例,互聯(lián)網(wǎng)上作為金融信息中UGC重要形式之一的用戶評(píng)論,既表達(dá)了用戶對(duì)證券市場的個(gè)體觀點(diǎn),又涵蓋了用戶與股票、用戶與用戶之間的關(guān)系,兼具內(nèi)容與關(guān)聯(lián)的特征,成為情感分析研究的一個(gè)新熱點(diǎn)。目前,帶有情緒信息的金融評(píng)論在互聯(lián)網(wǎng)上呈爆炸式增長,這些情緒信息對(duì)普通投資者、公司機(jī)構(gòu)和國家政府等各級(jí)別的用戶都有重要意義,如何有效的將帶有情緒信息的金融評(píng)論轉(zhuǎn)化成有助于各類用戶應(yīng)用的有價(jià)值資源,已成為當(dāng)前需要迫切解決的問題之一。對(duì)于主觀性文本的情感分析研究正是適應(yīng)這種需求,希望架設(shè)一座用戶到情緒信息的橋梁,使用戶能有效獲取情緒信息。從實(shí)踐角度而言,利用這些情緒信息一方面可以幫助金融、證券監(jiān)管部門及時(shí)了解投資者的情緒變化,特別是股災(zāi)或者瘋牛這樣極端行情下的情緒反饋,為后續(xù)的政策引導(dǎo)提供線索依據(jù);另一方面可以給出不同類別投資者的情緒指數(shù)變化曲線,同時(shí)也可與其他主要證券行情分析指數(shù)聯(lián)合構(gòu)建出合理的投資模型,這在一定程度上為投資者提供更全面的投資決策支持。
目前情感分析方法大致有兩類。第一種是基于規(guī)則的方法。主要先根據(jù)情感詞典找出文本中出現(xiàn)的情感詞,然后進(jìn)行簡單的情感極性統(tǒng)計(jì),根據(jù)最終得分與事先設(shè)定閾值比較得出情感極性結(jié)論,一般用于篇章級(jí)別的情感分析。第二種是基于機(jī)器學(xué)習(xí)的方法。通過對(duì)大量標(biāo)注語料的訓(xùn)練,生成情感分類器,用來對(duì)測試文本進(jìn)行分類。
(1)基于規(guī)則的方法。目前的方法主要是設(shè)計(jì)規(guī)則提取情感詞和極性判定,然后對(duì)所有的情感詞進(jìn)行簡單情感極性統(tǒng)計(jì)求得文本的整體情感極性,該方法更多的應(yīng)用于篇章的情感分析。另外,通過計(jì)算詞語的語義傾向,綜合考慮極性元素分布、密度和語義強(qiáng)度進(jìn)行情感詞的擴(kuò)展,進(jìn)一步修正文本的整體情感極性。
(2)基于機(jī)器學(xué)習(xí)的方法。這種方法主要使用情感詞、詞語共現(xiàn)對(duì)、句法模板、主題相關(guān)特征等作為分類特征,使用基于機(jī)器學(xué)習(xí)的分類方法進(jìn)行情感/傾向性分析。常用的分類方法有:中心向量分類法、KNN分類法、感知器分類法、貝葉斯分類法、最大熵分類法和支持向量機(jī)分類法等。一般過程是首先通過對(duì)訓(xùn)練文檔進(jìn)行手工標(biāo)注,生產(chǎn)訓(xùn)練模型,然后進(jìn)行測試文檔的預(yù)測。該方法目前在句子級(jí)別的情感分析中有廣泛的應(yīng)用。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工商大學(xué),未經(jīng)浙江工商大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710093687.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測方法及系統(tǒng)
- 記錄媒體、記錄設(shè)備、記錄方法、數(shù)據(jù)搜索設(shè)備、數(shù)據(jù)搜索方法和數(shù)據(jù)生成設(shè)備
- 一種主觀性試題的計(jì)算機(jī)考核方法
- 一種治療主觀性耳鳴的穴位注射液及其制備方法
- 一種商品知識(shí)圖譜的構(gòu)建方法
- 基于深度學(xué)習(xí)的主觀性文本情感分析方法
- 基于多目標(biāo)決策層次分析法的電壓暫降嚴(yán)重度評(píng)估方法
- 一種基于主成分分析的圖像分割的方法
- 文本類別確定方法和裝置
- 一種涉及金融投研的數(shù)據(jù)處理方法及終端
- 一種基于預(yù)訓(xùn)練語言模型的觀點(diǎn)摘要評(píng)價(jià)系統(tǒng)





