[發明專利]情感原因對抽取模型的訓練方法、裝置、設備及介質有效
| 申請號: | 202210039899.2 | 申請日: | 2022-01-14 |
| 公開(公告)號: | CN114065769B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 琚生根;高德辰;周剛 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 王新哲 |
| 地址: | 610065 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感 原因 抽取 模型 訓練 方法 裝置 設備 介質 | ||
1.一種情感原因對抽取模型的訓練方法,其特征在于,所述情感原因對抽取模型包括第一編碼網絡、第二編碼網絡、圖注意力網絡、配對網絡及預測網絡,所述方法包括:
將文檔樣本輸入至所述第一編碼網絡,得到文檔樣本中每個子句的情感子句表示和每個子句的原因子句表示;
基于第二編碼網絡,根據每個所述子句的情感子句表示和原因子句表示,得到每個所述子句的第一情感子句預測結果和第一原因子句預測結果,并得到每個所述子句的情感輸出和每個所述子句的原因輸出,其中,所述每個所述子句的情感輸出通過子句的第一原因子句預測結果和情感子句表示得到,所述每個所述子句的原因輸出通過子句的第一情感子句預測結果和原因子句表示得到;
將每個所述子句的情感輸出和原因輸出輸入至圖注意力網絡,得到每個所述子句更新后的情感輸出和更新后的原因輸出,其中,所述圖注意力網絡用于根據每個所述子句的情感輸出和原因輸出,更新每個所述子句的情感輸出和原因輸出;
基于所述配對網絡,根據每個所述子句更新后的情感輸出得到每個所述子句的情感表示,及根據每個所述子句更新后的原因輸出得到每個所述子句的原因表示,并將所有所述子句的情感表示和原因表示兩兩配對,得到情感原因對;
將所有所述情感原因對輸入至預測網絡,得到情感原因對預測結果;
根據第一預設算式,得到所述情感原因對預測結果對應的情感原因對預測損失值,并利用所述情感原因對預測損失值更新所述情感原因對抽取模型,其中,所述第一預設算式包括:
式中,
2.根據權利要求1所述的方法,其特征在于,所述圖注意力網絡包含依次相連的預設數量層圖注意力層,第一層圖注意力層用于更新每個所述子句的情感輸出和原因輸出,圖注意力網絡的其余每層所述圖注意力層均用于更新上一個圖注意力層的情感輸出和原因輸出。
3.根據權利要求1所述的方法,其特征在于,所述基于所述配對網絡,根據每個所述子句更新后的情感輸出得到每個所述子句的情感表示,及根據每個所述子句更新后的原因輸出得到每個所述子句的原因表示,包括:
將每個所述子句更新后的情感輸出輸入至所述配對網絡的第二預設算式,得到情感表示,及將每個所述子句更新后的原因輸出輸入至所述配對網絡的第三預設算式,得到原因表示;
所述第二預設算式包括:
式中,表示第
所述第三預設算式包括:
式中,表示第
4.根據權利要求3所述的方法,其特征在于,所述將所有所述子句的情感表示和原因表示兩兩配對,得到情感原因對,包括:
基于雙仿射機制,將每個所述子句的情感表示作為中心項,將每個所述子句的原因表示作為從屬項,并基于配對網絡中的預設算式集,將所有所述中心項和所有所述從屬項兩兩配對,得到對應的情感原因對。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210039899.2/1.html,轉載請聲明來源鉆瓜專利網。





