[發明專利]基于輔助任務的情感分析方法、裝置、設備及存儲介質有效
| 申請號: | 202011175410.1 | 申請日: | 2020-10-28 |
| 公開(公告)號: | CN112307757B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 李明凡;周凱捷 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/35;G06N3/0464;G06N3/0442;G06N3/08 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 輔助 任務 情感 分析 方法 裝置 設備 存儲 介質 | ||
1.一種基于輔助任務的情感分析方法,其特征在于,所述方法包括:
獲取訓練集中的訓練文本,并從所述訓練文本中提取特征信息,所述特征信息包括文本屬性和關鍵信息;
將所述訓練文本、所述文本屬性以及所述關鍵信息輸入指定的情感分析模型,得到與所述文本屬性對應的情感類別的第一預測結果,并根據所述第一預測結果確定所述文本屬性對應的情感類別的第一損失函數值;
所述將所述訓練文本、所述文本屬性以及所述關鍵信息輸入指定的情感分析模型,得到與所述文本屬性對應的情感類別的第一預測結果之前,還包括:
對所述訓練文本進行預處理,所述預處理包括分詞處理或規范化處理;
對所述預處理得到的訓練文本進行數字化處理,以對所述訓練文本中的各詞添加數字標識,并對所述訓練文本中的文本屬性添加情感類別標簽;
所述將所述訓練文本、所述文本屬性以及所述關鍵信息輸入指定的情感分析模型,得到與所述文本屬性對應的情感類別的第一預測結果,包括:
將所述數字化處理的訓練文本、所述添加情感類別標簽的文本屬性以及所述訓練文本中的關鍵信息輸入指定的情感分析模型中的理解模塊,得到所述訓練文本的理解表示和所述文本屬性的理解表示;
將所述訓練文本的理解表示、所述文本屬性的理解表示以及所述關鍵信息輸入所述指定的情感分析模型中的交互與分類模塊,得到與所述文本屬性對應的情感類別的情感概率分布;
所述根據所述第一預測結果確定所述文本屬性對應的情感類別的第一損失函數值,包括:
根據所述文本屬性對應的情感類別的情感概率分布和所述文本屬性的情感類別標簽,計算得到情感分類的第一損失函數值;
獲取訓練輔助任務信息,并根據所述訓練輔助任務信息和所述訓練文本確定所述訓練輔助任務信息對應的第二預測結果,以及根據所述第二預測結果確定所述訓練輔助任務信息對應的第二損失函數值;
根據所述第一損失函數值和所述第二損失函數值訓練所述指定的情感分析模型,得到引入輔助任務的情感分析模型;
獲取待測試文本和輔助任務信息,并從所述待測試文本中提取特征信息,將所述待測試文本、所述輔助任務信息、所述特征信息輸入所述引入輔助任務的情感分析模型,得到所述待測試文本針對所述特征信息的文本屬性的情感類別的目標預測結果。
2.根據權利要求1所述的方法,其特征在于,所述根據所述訓練輔助任務信息和所述訓練文本確定所述訓練輔助任務信息對應的第二預測結果,包括:
獲取所述訓練文本的理解表示;
將所述訓練輔助任務信息、所述訓練文本的理解表示和所述關鍵信息輸入輔助任務模塊,得到所述訓練輔助任務信息對應的第二預測結果。
3.根據權利要求2所述的方法,其特征在于,所述訓練輔助任務信息包括輔助任務標簽;所述根據所述第二預測結果確定所述訓練輔助任務信息對應的第二損失函數值,包括:
獲取所述訓練輔助任務信息中包括的輔助任務標簽;
根據所述第二預測結果和所述輔助任務標簽,確定所述訓練輔助任務信息對應的第二損失函數值。
4.根據權利要求2所述的方法,其特征在于,所述根據所述第一損失函數值和所述第二損失函數值訓練所述指定的情感分析模型,得到引入輔助任務的情感分析模型,包括:
將所述第一損失函數值和所述第二損失函數值進行加權求和得到目標損失函數值;
根據所述目標損失函數值訓練所述指定的情感分析模型和所述輔助任務模塊,得到引入輔助任務的情感分析模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011175410.1/1.html,轉載請聲明來源鉆瓜專利網。





