[發明專利]中文文本情感分析方法、裝置、計算機設備和存儲介質有效
| 申請號: | 202110594523.3 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113177111B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 胡艷麗;童譚騫;李川;左浩;譚立君 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 長沙國科天河知識產權代理有限公司 43225 | 代理人: | 段盼姣 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 中文 文本 情感 分析 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種中文文本情感分析方法、裝置、計算機設備和存儲介質。所述方法包括:獲取中文文本,并對其進行預處理得到訓練樣本;構建中文文本情感分析網絡,采用訓練樣本對該網絡進行訓練,得到訓練好的中文文本情感分析模型;將待測樣本輸入到中文文本情感分析模型中,得到情感極性分類。本模型采用雙向門控循環單元提取文本序列特征,然后采用自注意機制結合全局信息對特征進行初步篩選,通過不同大小的卷積核對局部特征多粒度的提取,充分挖掘文本內部結構關系,再用自注意力機制取代傳統的池化方法,提高關鍵局部向量的提取保留能力,提高模型的判斷準確性。本模型較目前主流方法,在情感極性預測的準確性上有一定提高。
技術領域
本申請涉及自然語言處理技術領域,特別是涉及一種中文文本情感分析方法、裝置、計算機設備和存儲介質。
背景技術
互聯網的高速發展和社交網絡的無孔不入帶來了文本信息爆炸式增長。其中線上評論文本如時事新聞評論、網上購物評論、書評影評等因其具有的針對性強、價值密度較高的特點受到學術界的普遍關注。中國互聯網信息中心(CNNIC)2020年9月份的統計報告顯示,我國網民規模已達9.4億,占全球總數的1/5。中文語料環境下的情感分析能起到跟蹤社情輿論、提高交易質量、反饋讀者滿意度等作用,具有較強的研究價值。情感極性分析是情感分類的一種方法,將文本的情感分為正極性和負極性,如滿意、興奮、認可等積極情感被歸為正極性情感,而悲傷、失落、怨恨等歸為負極性情感。
現有的研究中大部分基于詞向量的循環神經網絡與卷積神經網絡模型對于文本特征的提取和保留能力不足,導致與情感極性相關的特征被丟棄,影響分類的準確性。
發明內容
基于此,有必要針對上述技術問題,提供一種中文文本情感分析方法、裝置、計算機設備和存儲介質。
一種中文文本情感分析方法,所述方法包括:
獲取中文文本,并對所述中文文本進行預處理得到訓練樣本。
構建中文文本情感分析網絡;所述中文文本情感分析網絡包括詞嵌入層、特征提取網絡及分類網絡;所述特征提取網絡包括雙向門限循環單元層、自注意力層、多粒度卷積層及基于自注意力的池化層;所述詞嵌入層用于采用分詞模塊將所述訓練樣本轉化為詞向量序列;所述特征提取網絡用于通過所述雙向門限循環單元層學習所述詞向量序列的文本序列化特征,通過所述自注意力層對所述文本序列化特征進行特征篩選得到新文本特征,通過所述多粒度卷積層提取所述新文本特征中不同尺度的局部特征得到文本數據特征圖,并通過基于自注意力的池化層對所述文本數據特征圖進行特征提取得到局部特征序列;所述分類網絡用于將所述局部特征序列進行特征融合,并進行情感極性分類。
將所述訓練樣本輸入到所述中文文本情感分析網絡中進行訓練,得到訓練好的中文文本情感分析模型。
獲取待測中文文本,并對所述待測中文文本進行預處理得到待測樣本。
將所述待測樣本輸入到所述中文文本情感分析模型中,得到情感極性分類。
在其中一個實施例中,獲取中文文本,并對所述中文文本進行預處理得到訓練樣本,包括:
獲取中文文本。
對所述中文文本進行繁簡體統一處理,并剔除標點等特殊字符,得到訓練樣本。
在其中一個實施例中,將所述訓練樣本輸入到所述中文文本情感分析網絡中進行訓練,得到訓練好的中文文本情感分析模型,包括:
將所述訓練樣本輸入到所述詞嵌入層中,采用分詞模塊將所述訓練樣本轉化為詞序列,并通過預訓練詞向量模型對詞序列進行詞向量映射,得到所述詞向量序列。
將所述詞向量序列輸入到所述雙向門限循環單元層中,得到所述文本序列化特征。
將所述文本序列化特征輸入到自注意力層中,得到所述新文本特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110594523.3/2.html,轉載請聲明來源鉆瓜專利網。





