[發明專利]一種文本情感分類方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010748294.1 | 申請日: | 2020-07-30 |
| 公開(公告)號: | CN111930940A | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 吳雙志;謝軍;李沐 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/35;G06N3/04 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;賈允 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 情感 分類 方法 裝置 電子設備 存儲 介質 | ||
本發明涉及自然語言處理及機器學習技術領域,具體是一種文本情感分類方法、裝置、電子設備及存儲介質,所述方法包括:獲取待分類的目標文本,對所述目標文本進行處理,得到所述目標文本的詞向量序列;利用預先訓練的語義編碼模型對所述詞向量序列進行處理,得到所述詞向量序列對應的詞語義向量序列以及所述目標文本的語義向量;將所述詞向量序列、所述詞語義向量序列以及所述語義向量輸入預先訓練的情感生成模型,得到所述目標文本的情感向量,所述情感生成模型為基于注意力的神經網絡模型;將所述語義向量和所述情感向量輸入預先訓練的情感分類模型,得到所述目標文本的情感分類結果。本發明引入動態生成的情感向量,提高了情感分類的準確性。
技術領域
本發明涉及自然語言處理及機器學習技術領域,特別涉及一種文本情感分類方法、裝置、電子設備及存儲介質。
背景技術
隨著互聯網技術的發展,網絡產品越來越多。用戶在使用網絡產品的過程中或者使用網絡產品后,通常會輸入表達自身需求或觀點的網絡文本,例如在智能客服或者語音助手中輸入需要解決的問題,或者在使用某項服務后發表針對該項服務的評價等等。由于網絡文本蘊含著豐富的情感信息,對應著用戶相應的心理狀態,通過對用戶輸入的網絡文本進行情感分析,判定它的情感類別,能夠根據分析結果確定恰當的處理策略,以提供更符合用戶需求的網絡產品。因此情感分析技術被廣泛應用于消費決策、輿情分析、個性化推薦和人機交互等領域。
傳統的情感分類方法通常利用多元文法、詞法等作為特征,采用傳統的分類模型進行分類,例如支持向量機、最大熵模型等。近期隨著神經網絡以及深度學習的發展,神經網絡也被用在了情感分類領域。現有的情感分類方法一種是利用外部詞典幫助情感分類的方法,該方法在長短時記憶(Long Short Term Memory,LSTM)網絡的基礎上提出了自注意力網絡,并將外部詞典引入到模型的訓練中;另一種是利用領域知識的情感分類方法,該方法在預訓練語言模型的基礎上引入了領域知識,其目的是針對不同的情感分類任務,提取相應的領域知識,來幫助語言模型更好的適應新場景、新任務。現有的情感分類方法在訓練分類模型的過程中需要依賴外部的情感詞典或者領域知識,可能會出現由于標注不一致帶來的不匹配問題或者由于詞典覆蓋度不夠導致情感分類的準確性較差的問題。
發明內容
針對現有技術的上述問題,本發明的目的在于提供一種文本情感分類方法、裝置、電子設備及存儲介質,能夠提高情感分類的準確性。
為了解決上述問題,本發明提供一種文本情感分類方法,包括:
獲取待分類的目標文本,對所述目標文本進行處理,得到所述目標文本的詞向量序列;
利用預先訓練的語義編碼模型對所述詞向量序列進行處理,得到所述詞向量序列對應的詞語義向量序列以及所述目標文本的語義向量;
將所述詞向量序列、所述詞語義向量序列以及所述語義向量輸入預先訓練的情感生成模型,得到所述目標文本的情感向量,所述情感生成模型為基于注意力的神經網絡模型;
將所述語義向量和所述情感向量輸入預先訓練的情感分類模型,得到所述目標文本的情感分類結果。
本發明另一方面提供一種文本情感分類裝置,包括:
詞向量序列生成模塊,用于獲取待分類的目標文本,對所述目標文本進行處理,得到所述目標文本的詞向量序列;
語義向量生成模塊,用于利用預先訓練的語義編碼模型對所述詞向量序列進行處理,得到所述詞向量序列對應的詞語義向量序列以及所述目標文本的語義向量;
情感向量生成模塊,用于將所述詞向量序列、所述詞語義向量序列以及所述語義向量輸入預先訓練的情感生成模型,得到所述目標文本的情感向量,所述情感生成模型為基于注意力的神經網絡模型;
情感分類模塊,用于將所述語義向量和所述情感向量輸入預先訓練的情感分類模型,得到所述目標文本的情感分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010748294.1/2.html,轉載請聲明來源鉆瓜專利網。





