[發明專利]一種情感分類方法及裝置在審
| 申請號: | 202010796531.1 | 申請日: | 2020-08-10 |
| 公開(公告)號: | CN111950258A | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 崔文強;陳健;李思雯 | 申請(專利權)人: | 深圳市慧擇時代科技有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 夏歡 |
| 地址: | 518000 廣東省深圳市南山區粵*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 情感 分類 方法 裝置 | ||
1.一種情感分類方法,其特征在于,所述方法包括:
獲取待處理文本;
從所述待處理文本中獲取目標文本,所述目標文本用于表征所述待處理文本中實體對象之間的句法關系;
基于所述待處理文本中的各個詞語和所述目標文本中的各個詞語,對所述待處理文本進行情感分類,得到所述待處理文本的情感類型。
2.根據權利要求1所述的方法,其特征在于,所述從待處理文本中獲取目標文本包括:
從所述待處理文本中獲取第一類型關鍵詞以及從所述待處理文本中獲取第二類型關鍵詞,所述第一類型關鍵詞用于表征所述待處理文本的情感,所述第二類型關鍵詞表征所述待處理文本中實體對象之間的句法關系;
基于所述第一類型關鍵詞和所述第二類型關鍵詞,得到所述目標文本;
如果所述待處理文本中沒有獲取到所述第一類型關鍵詞,基于所述第二類型關鍵詞得到所述目標文本。
3.根據權利要求2所述的方法,其特征在于,所述從所述待處理文本中獲取第二類型關鍵詞包括:對所述待處理文本進行句法分析,得到所述待處理文本中至少作為主語和謂語的關鍵詞;
將所述待處理文本中至少作為主語和謂語的關鍵詞確定為所述第二類型關鍵詞。
4.根據權利要求1至3任意一項所述的方法,其特征在于,所述基于所述待處理文本中的各個詞語和所述目標文本中的各個詞語,對所述待處理文本進行情感分類,得到所述待處理文本的情感類型包括:
對所述待處理文本中的各個詞語進行編碼,得到所述待處理文本的詞向量矩陣,以及對所述目標文本中的各個詞語進行編碼,得到所述目標文本的詞向量矩陣;
通過第一類型神經網絡對所述待處理文本的詞向量矩陣進行特征提取,得到所述待處理文本的特征數據,并通過注意力機制對所述待處理文本的特征數據進行處理,得到所述待處理文本的特征向量和權重;
通過第二類型神經網絡對所述目標文本的詞向量矩陣進行特征提取,得到所述目標文本的特征數據,并通過注意力機制對所述目標文本的特征數據進行處理,得到所述目標文本的特征向量和權重;
基于所述待處理文本的特征向量和權重以及所述目標文本的特征向量的權重,得到所述待處理文本的目標特征向量和目標權重;
基于所述待處理文本的目標特征向量和目標權重,得到所述待處理文本的情感類型。
5.根據權利要求4所述的方法,其特征在于,所述通過第一類型神經網絡對所述待處理文本的詞向量矩陣進行特征提取,得到所述待處理文本的特征數據包括:使用全連接神經網絡對所述待處理文本的詞向量矩陣進行特征提取,得到所述待處理文本的特征數據;
所述通過第二類型神經網絡對所述目標文本的詞向量矩陣進行特征提取,得到所述目標文本的特征數據包括:使用BI-LSTM神經網絡對所述目標文本的詞向量矩陣進行特征提取,得到所述目標文本的特征數據;其中,在任一時刻t的BI-LSTM神經網絡的前向輸出和后向輸出相結合得到隱藏層,計算公式如下:
f表示sigmoid激活函數,W(1)、U(1)是不同時刻遺忘門參數,b表示偏量參數,表示前向隱層參數和后向隱層參數疊加,表示t時刻的前向輸出,表示t時刻的后向輸出,xt表示t時刻的輸入,表示t-1時刻的前向輸出,表示t+1時刻的前向輸出。
6.根據權利要求4所述的方法,其特征在于,所述注意力機制得到特征向量和權重包括:
根據注意力機制公式得到特征向量和權重:
ut=tanh(wwht+bw)
ww和bw是注意力機制的可調節參數,ht為特征數據,ut為ht的隱含狀態,uw為分類器參數,αt表示每個詞的重要程度以表示權重,V表示經過注意力機制計算后的特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市慧擇時代科技有限公司,未經深圳市慧擇時代科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010796531.1/1.html,轉載請聲明來源鉆瓜專利網。





