[發(fā)明專利]一種基于改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)的中文文本情感分析方法在審
| 申請?zhí)枺?/td> | 202110658901.X | 申請日: | 2021-06-15 |
| 公開(公告)號: | CN113435192A | 公開(公告)日: | 2021-09-24 |
| 發(fā)明(設(shè)計)人: | 王麗亞;陳哲 | 申請(專利權(quán))人: | 王麗亞 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京陽光天下知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11671 | 代理人: | 趙飛 |
| 地址: | 246680 安徽省*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改變 神經(jīng)網(wǎng)絡(luò) 通道 基數(shù) 中文 文本 情感 分析 方法 | ||
本發(fā)明提供了一種基于改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)的中文文本情感分析方法,包括:步驟Step1:將中文文本數(shù)據(jù)集通過詞嵌入系統(tǒng)進(jìn)行預(yù)處理,得到中文文本信息對應(yīng)的詞序列和所述詞序列對應(yīng)的詞向量矩陣;步驟Step2:構(gòu)建多通道模型,所述多通道模型由n組并行的CNN?BiGRU?Attention網(wǎng)絡(luò)組成,利用多通道模型進(jìn)行特征提取,得到相應(yīng)的n個局部特征向量;步驟Step3:使用全連接函數(shù)將所述n個局部特征向量拼接在一起生成全局特征向量;步驟Step4:將生成的所述全局特征向量,輸入sigmoid分類器進(jìn)行分類,得到最終的情感分析結(jié)果,本發(fā)明可通過改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)判斷中文文本的情感傾向,且能有效地提高中文文本情感分析的準(zhǔn)確率。
技術(shù)領(lǐng)域
本發(fā)明涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及到一種基于改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)的中文文本情感分析方法。
背景技術(shù)
文本情感分析(Sentiment Analysis)是指利用自然語言處理和文本挖掘技術(shù),對帶有情感色彩的主觀性文本進(jìn)行分析、處理和抽取的過程。其涉及領(lǐng)域包括自然語言處理、文本挖掘、信息檢索、信息抽取和機器學(xué)習(xí)等。隨著社交多媒體的發(fā)展,提供了大量具有情感傾向的評論數(shù)據(jù)等,因此情感分析技術(shù)在了解人們對某些事件的態(tài)度和看法方面中扮演著越來越重要的角色,神經(jīng)深度學(xué)習(xí)模型被廣泛應(yīng)用到情感分析方面,目前,深度學(xué)習(xí)應(yīng)用于情感分析領(lǐng)域的技術(shù)主要有詞嵌入、CNN、RNN和注意力機制等,但RNN等網(wǎng)絡(luò)具有高復(fù)雜度的缺點,另外,現(xiàn)有的情感分析方法大多都是通過構(gòu)建單通道或雙通道的神經(jīng)網(wǎng)絡(luò)模型來進(jìn)行文本特征的提取,而通道模型隨著網(wǎng)絡(luò)層數(shù)的增加,性能將受到影響,不能夠充分的提取文本的特征,針對此問題,本文提出基于改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)的中文文本情感分析方法。
綜上所述,提供一種可通過改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)判斷中文文本的情感傾向,且能有效地提高中文文本情感分析準(zhǔn)確率的基于改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)的中文文本情感分析方法,是本領(lǐng)域技術(shù)人員急需解決的問題。
發(fā)明內(nèi)容
本方案針對上文提到的問題和需求,提出一種基于改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)的中文文本情感分析方法,其由于采取了如下技術(shù)方案而能夠解決上述技術(shù)問題。
為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于改變神經(jīng)網(wǎng)絡(luò)通道基數(shù)的中文文本情感分析方法,包括以下步驟:步驟Step1:將中文文本數(shù)據(jù)集通過詞嵌入系統(tǒng)進(jìn)行預(yù)處理,得到中文文本信息對應(yīng)的詞序列和所述詞序列對應(yīng)的詞向量矩陣,所述詞向量用于表征所述詞序列中的詞和詞的位置;
步驟Step2:構(gòu)建多通道模型,所述多通道模型由n組并行的CNN-BiGRU-Attention網(wǎng)絡(luò)組成,利用多通道模型進(jìn)行特征提取,得到相應(yīng)的n個局部特征向量;
步驟Step3:使用全連接函數(shù)將所述n個局部特征向量拼接在一起生成全局特征向量;
步驟Step4:將生成的所述全局特征向量,輸入sigmoid分類器進(jìn)行分類,得到最終的情感分析結(jié)果。
進(jìn)一步地,所述預(yù)處理包括:獲取中文文本數(shù)據(jù)集,將所述中文文本數(shù)據(jù)集中的原始文本數(shù)據(jù)進(jìn)行分詞,得到單個字組成的句子序列,將所述句子序列輸入word2vec中的Skip-gram模型訓(xùn)練詞向量,進(jìn)而得到所述句子序列對應(yīng)的詞向量矩陣S={x1,x2,…,xn},其中,句子序列中每個字的字向量為xi,xi∈Rn×d,n為字?jǐn)?shù),d為向量維度。
更進(jìn)一步地,每組CNN-BiGRU-Attention網(wǎng)絡(luò)的特征提取過程包括:
A.將所述詞向量矩陣輸入CNN網(wǎng)絡(luò)提取輸入文本數(shù)據(jù)的局部特征信息,利用卷積神經(jīng)網(wǎng)絡(luò)CNN的3種尺寸的卷積核將所述詞向量矩陣對應(yīng)的字向量按不同單詞數(shù)量劃分組合提取特征,得到3種對應(yīng)的不同特征值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于王麗亞,未經(jīng)王麗亞許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110658901.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





