[發(fā)明專(zhuān)利]一種針對(duì)視角級(jí)文本的情感分類(lèi)系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201810250039.7 | 申請(qǐng)日: | 2018-03-26 |
| 公開(kāi)(公告)號(hào): | CN108470061A | 公開(kāi)(公告)日: | 2018-08-31 |
| 發(fā)明(設(shè)計(jì))人: | 廖祥文;陳國(guó)龍;謝媛媛;楊定達(dá) | 申請(qǐng)(專(zhuān)利權(quán))人: | 福州大學(xué) |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30 |
| 代理公司: | 福州元?jiǎng)?chuàng)專(zhuān)利商標(biāo)代理有限公司 35100 | 代理人: | 蔡學(xué)俊 |
| 地址: | 350108 福建省福*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視角 情感分類(lèi) 文本 特征抽取模塊 預(yù)處理模塊 分類(lèi)函數(shù) 分類(lèi)結(jié)果 更新參數(shù) 記憶網(wǎng)絡(luò) 情感分析 輸出模塊 通用性強(qiáng) 文本數(shù)據(jù) 詞向量 構(gòu)建 卷積 字典 注意力 取出 分析 | ||
本發(fā)明涉及一種針對(duì)視角級(jí)文本的情感分類(lèi)系統(tǒng)。包括文本數(shù)據(jù)預(yù)處理模塊,用于得到詞向量字典;特征抽取模塊,卷積記憶網(wǎng)絡(luò)模型用于構(gòu)建視角相關(guān)的注意力,抽取出視角相關(guān)的特征,并根據(jù)誤差不斷更新參數(shù);分類(lèi)結(jié)果輸出模塊,用分類(lèi)函數(shù)得到文本最終的情感分類(lèi)結(jié)果。本發(fā)明能夠較好地進(jìn)行視角級(jí)觀(guān)點(diǎn)類(lèi)別的分析且通用性強(qiáng),能站在數(shù)據(jù)使用者的角度進(jìn)行情感分析。
技術(shù)領(lǐng)域
本發(fā)明涉及情感分析和觀(guān)點(diǎn)挖掘領(lǐng)域,更具體地,涉及一種針對(duì)視角級(jí)文本的情感分類(lèi)系統(tǒng),能夠較好地進(jìn)行視角級(jí)觀(guān)點(diǎn)類(lèi)別的分析且通用性強(qiáng),能站在在數(shù)據(jù)使用者的角度進(jìn)行情感分析。
背景技術(shù)
當(dāng)前,有很多技術(shù)方法可用于文本情感分類(lèi)。傳統(tǒng)的文本分類(lèi)方法單純從文本分類(lèi)的角度出發(fā),很難確定文中不同視角下情感類(lèi)別的不同。區(qū)別于傳統(tǒng)的文本分類(lèi)方法,如何利用文中不同視角的信息,進(jìn)行針對(duì)視角的文本情感分類(lèi),是視角級(jí)文本情感分類(lèi)的問(wèn)題關(guān)鍵。傳統(tǒng)的研究工作主要是基于有監(jiān)督的機(jī)器學(xué)習(xí)的方法,該方法通過(guò)構(gòu)建視角相關(guān)的特征,使用支持向量機(jī)(SVMs)分類(lèi)器進(jìn)行情感分類(lèi),提高了情感分類(lèi)結(jié)果。這一類(lèi)基于特征工程與淺層線(xiàn)性模型的方法雖然取得了一定的成效,但是需要大量的特征工程,耗時(shí)耗力,并且受限于人工設(shè)計(jì)的規(guī)則和特征的有效性以及模型的學(xué)習(xí)能力,故而其性能還有待提升。
當(dāng)前,隨著深度學(xué)習(xí)的快速發(fā)展,基于多層神經(jīng)網(wǎng)絡(luò)的表示學(xué)習(xí)模型在語(yǔ)義表示與情感分析運(yùn)用方面更具優(yōu)勢(shì)。許多研究者們也將這些模型用于視角級(jí)的文本情感分類(lèi)。神經(jīng)網(wǎng)絡(luò)模型與有監(jiān)督的機(jī)器學(xué)習(xí)方法相比,能夠自動(dòng)從數(shù)據(jù)中學(xué)習(xí)文本表示,從而避免了大量的特征工程,在捕獲視角和上下文之間復(fù)雜的語(yǔ)義關(guān)系方面也有更好的拓展性。但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)文本分類(lèi)模型只是簡(jiǎn)單地將視角作為特征之一用于模型學(xué)習(xí),沒(méi)有充分考慮視角和上下文之間的關(guān)系,不能衡量給定視角的上下文中每個(gè)詞對(duì)視角級(jí)情感分類(lèi)的語(yǔ)義貢獻(xiàn)程度。記憶網(wǎng)絡(luò)模型在自然語(yǔ)言處理中應(yīng)用廣泛,能夠較好地對(duì)視角和上下文進(jìn)行建模,得到上下文的語(yǔ)義分布情況,并且與循環(huán)神經(jīng)網(wǎng)絡(luò)模型相比,該方法更加簡(jiǎn)單、計(jì)算速度更快。但忽略了詞序信息,上下文中的詞之間是相互獨(dú)立的。卷積神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)局部特征的能力,可以通過(guò)卷積層構(gòu)造短語(yǔ)特征,密切上下文之間的聯(lián)系。
當(dāng)前,視角級(jí)情感分類(lèi)方法未充分利用文本中的視角信息,無(wú)法有效地挖掘出潛在的觀(guān)點(diǎn)信息。近年來(lái),視角級(jí)情感分類(lèi)得到了國(guó)內(nèi)外許多學(xué)者和研究機(jī)構(gòu)的高度重視,被國(guó)際語(yǔ)義評(píng)測(cè)列為評(píng)測(cè)任務(wù)之一,是中國(guó)計(jì)算機(jī)學(xué)會(huì)舉辦的大數(shù)據(jù)與計(jì)算智能大賽的賽事之一,也是中文文本傾向性評(píng)測(cè)會(huì)議新的研究關(guān)注點(diǎn)。視角級(jí)文本情感分類(lèi)利用了文本中不同視角的信息,進(jìn)行針對(duì)視角的文本情感分類(lèi),能夠站在數(shù)據(jù)使用者的角度進(jìn)行特定的情感分析,提供更加細(xì)粒度的信息,有效提高情感分析系統(tǒng)提供的分析結(jié)果的準(zhǔn)確程度,有助于研判人員更加了解人們對(duì)熱點(diǎn)話(huà)題、組織、產(chǎn)品等各種實(shí)體的真實(shí)觀(guān)點(diǎn)和看法,為研判人員提供更加有效而準(zhǔn)確的信息。這就對(duì)視角級(jí)文本情感分類(lèi)技術(shù)提出了一個(gè)挑戰(zhàn):如何構(gòu)建一個(gè)有效的視角級(jí)文本情感分類(lèi)原型系統(tǒng)來(lái)滿(mǎn)足其需要。因此,人們迫切希望有一種準(zhǔn)確高效的視角級(jí)文本情感分類(lèi)方法,該方法能夠自動(dòng)抽取出有效特征,并對(duì)特征進(jìn)行抽象和組合,最終識(shí)別出文本中不同視角下的的不同觀(guān)點(diǎn)類(lèi)別。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種針對(duì)視角級(jí)文本的情感分類(lèi)系統(tǒng),能夠自動(dòng)抽取出有效特征,并對(duì)特征進(jìn)行抽象和組合,最終識(shí)別出文本中給定視角的的觀(guān)點(diǎn)類(lèi)別。
為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種針對(duì)視角級(jí)文本的情感分類(lèi)系統(tǒng),包括:
一數(shù)據(jù)預(yù)處理模塊,用于將文本進(jìn)行分詞,得到文本詞向量字典;
一特征抽取模塊,通過(guò)卷積記憶網(wǎng)絡(luò)模型構(gòu)建視角相關(guān)的注意力,抽取出視角相關(guān)的特征,并根據(jù)誤差不斷更新參數(shù);
一分類(lèi)結(jié)果輸出模塊,根據(jù)特征抽取模塊得到的文本向量,用分類(lèi)函數(shù)得到最終的觀(guān)點(diǎn)分析結(jié)果。
在本發(fā)明一實(shí)施例中,所述數(shù)據(jù)預(yù)處理模塊中,詞向量字典的獲得借助了開(kāi)源的Glove工具事先在大預(yù)料里訓(xùn)練得到的詞向量。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于福州大學(xué),未經(jīng)福州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810250039.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 多視點(diǎn)視頻的視角切換以及編碼方法和裝置
- 一種斜視角圖像的模擬方法及裝置
- 一種斜視角圖像的模擬方法及裝置
- 一種基于虛擬現(xiàn)實(shí)視頻的多畫(huà)面同時(shí)觀(guān)看方法
- 一種基于視圖的特征匹配三維模型檢索方法
- 顯示裝置視角補(bǔ)償計(jì)算的方法、視角補(bǔ)償結(jié)構(gòu)及顯示裝置
- 基于全景照片的動(dòng)畫(huà)生成方法及裝置
- 顯示驅(qū)動(dòng)電路、顯示驅(qū)動(dòng)方法以及液晶顯示裝置
- 一種視角切換方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種虛擬現(xiàn)實(shí)多視角融合模型的設(shè)計(jì)方法
- 一種文本情感分類(lèi)方法及系統(tǒng)
- 分類(lèi)器的構(gòu)建方法及裝置、中文文本情感分類(lèi)方法及系統(tǒng)
- 一種利用表情符號(hào)對(duì)微博進(jìn)行情感傾向分類(lèi)的方法
- 一種音樂(lè)分類(lèi)方法及裝置
- 一種基于ResNet-GCN網(wǎng)絡(luò)的圖像情感分類(lèi)方法
- 基于情感的文本分類(lèi)處理方法、裝置和計(jì)算機(jī)設(shè)備
- 一種基于LSTM網(wǎng)絡(luò)和注意力機(jī)制的圖像情感分類(lèi)方法
- 音樂(lè)情感分類(lèi)方法
- 一種彈幕文本中情感詞的分類(lèi)方法、裝置及存儲(chǔ)介質(zhì)
- 一種基于自然語(yǔ)言理解的藏語(yǔ)情感句自動(dòng)分類(lèi)系統(tǒng)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 一種在線(xiàn)Web新聞內(nèi)容的抽取方法及系統(tǒng)
- 特征量抽取裝置、特征量抽取方法
- 一種中文事件觸發(fā)詞的抽取系統(tǒng)及方法
- 一種在線(xiàn)Web新聞內(nèi)容抽取系統(tǒng)
- 一種非結(jié)構(gòu)化數(shù)據(jù)標(biāo)注管理方法及系統(tǒng)
- 一種慢性病加重風(fēng)險(xiǎn)評(píng)估與告警系統(tǒng)
- 一種時(shí)序網(wǎng)絡(luò)動(dòng)態(tài)隱特征抽取方法和裝置
- 用于機(jī)器學(xué)習(xí)模型的特征抽取的方法和裝置
- 用于抽取特征的數(shù)據(jù)處理方法和系統(tǒng)
- 基于深度學(xué)習(xí)的文檔信息抽取方法及裝置





