[發明專利]一種基于改變神經網絡通道基數的中文文本情感分析方法在審
| 申請號: | 202110658901.X | 申請日: | 2021-06-15 |
| 公開(公告)號: | CN113435192A | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 王麗亞;陳哲 | 申請(專利權)人: | 王麗亞 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京陽光天下知識產權代理事務所(普通合伙) 11671 | 代理人: | 趙飛 |
| 地址: | 246680 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改變 神經網絡 通道 基數 中文 文本 情感 分析 方法 | ||
1.一種基于改變神經網絡通道基數的中文文本情感分析方法,其特征在于,包括以下步驟:
步驟Step1:將中文文本數據集通過詞嵌入系統進行預處理,得到中文文本信息對應的詞序列和所述詞序列對應的詞向量矩陣,所述詞向量用于表征所述詞序列中的詞和詞的位置;
步驟Step2:構建多通道模型,所述多通道模型由n組并行的CNN-BiGRU-Attention網絡組成,利用多通道模型進行特征提取,得到相應的n個局部特征向量;
步驟Step3:使用全連接函數將所述n個局部特征向量拼接在一起生成全局特征向量;
步驟Step4:將生成的所述全局特征向量,輸入sigmoid分類器進行分類,得到最終的情感分析結果。
2.如權利要求1所述的基于改變神經網絡通道基數的中文文本情感分析方法,其特征在于,所述預處理包括:獲取中文文本數據集,將所述中文文本數據集中的原始文本數據進行分詞,得到單個字組成的句子序列,將所述句子序列輸入word2vec中的Skip-gram模型訓練詞向量,進而得到所述句子序列對應的詞向量矩陣S={x1,x2,…,xn},其中,句子序列中每個字的字向量為xi,xi∈Rn×d,n為字數,d為向量維度。
3.如權利要求2所述的基于改變神經網絡通道基數的中文文本情感分析方法,其特征在于,每組CNN-BiGRU-Attention網絡的特征提取過程包括:
A.將所述詞向量矩陣輸入CNN網絡提取輸入文本數據的局部特征信息,利用卷積神經網絡CNN的3種尺寸的卷積核將所述詞向量矩陣對應的字向量按不同單詞數量劃分組合提取特征,得到3種對應的不同特征值;
B.將所述3種對應的不同特征值進行連接得到序列化短語特征U,將所述序列化短語特征U輸入BiGRU網絡進行學習,獲取本層次短語特征前后向聯系信息;
C.再利用前饋注意力機制Attention網絡突出局部特征中的重要信息,對步驟B提取的特征信息分配相應的權重并進行篩選,獲取最重要的情感信息特征。
4.如權利要求3所述的基于改變神經網絡通道基數的中文文本情感分析方法,其特征在于,所述CNN網絡包括卷積層、池化層和全連接層,將詞向量矩陣S輸入卷積層設置好的3種濾波器對輸入文本數據的局部特征進行提取,得到特征向量C=[c1,c2,…,cm],其中,cj為一個濾波器得到的特征向量,cj=[c1,c2,...,cn-h+1],m為卷積核個數,h是卷積核的尺寸,ci為局部特征向量;池化層通過采用MaxPooling技術對特征向量cj進行下采樣,求得局部值的最優解Mj,得到長度為m的特征向量M,M=[M1,M2,…,Mm],其中,Mj=max(c1,c2,...,cn-h+1)=max{cj};將所述特征向量M輸入全連接層得到向量U。
5.如權利要求4所述的基于改變神經網絡通道基數的中文文本情感分析方法,其特征在于,所述3種濾波器提取的特征通過池化后的輸出分別記為M3、M4、M5,用全連接函數將池化層處理后的向量M3、M4、M5連接成向量U,其中,U={M3,M4,M5}。
6.如權利要求5所述的基于改變神經網絡通道基數的中文文本情感分析方法,其特征在于,將所述向量U輸入BiGRU網絡進行學習,對序列短語特征前后向聯系信息進行提取,得到隱層狀態語義編碼ht。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于王麗亞,未經王麗亞許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110658901.X/1.html,轉載請聲明來源鉆瓜專利網。





