[發明專利]情感原因對抽取模型的訓練方法、裝置、設備及介質有效
| 申請號: | 202210039899.2 | 申請日: | 2022-01-14 |
| 公開(公告)號: | CN114065769B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 琚生根;高德辰;周剛 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 王新哲 |
| 地址: | 610065 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感 原因 抽取 模型 訓練 方法 裝置 設備 介質 | ||
本發明實施例公開了情感原因對抽取模型的訓練方法、裝置、設備及介質,涉及神經網絡模型領域,方法包括:將文檔樣本輸入至第一編碼網絡以對詞和子句編碼,得到情感子句表示和原因子句表示;對每個子句的兩種子句表示進行預測,得到兩種子句預測結果、情感輸出及原因輸出;將情感輸出和原因輸出輸入至圖注意力網絡以更新;基于配對網絡,根據更新后的兩種輸出得到對應的情感表示和原因表示,將情感表示和原因表示配對以得到情感原因對;根據預測網絡,得到情感原因對預測結果;根據預測結果計算損失值并更新模型。由此,本發明利用圖注意力網絡對每個子句間的相互關系進行提取,豐富了每個子句的情感輸出和原因輸出包含的信息,提高了準確率。
技術領域
本發明涉及神經網絡模型領域,尤其涉及一種情感原因對抽取模型的訓練方法、裝置、設備及介質。
背景技術
情感分類任務則主要是對文本進行情感分類,但是隨著自然語言處理技術的不斷發展,僅僅是對情感進行分類的任務已經不能夠滿足現實生活中的需求,所以研究者們將目光轉向到研究情感背后的原因。
因此,如何確定文本中的情感詞/句和指向情感詞/句的原因詞/句,為當下的主要研究方向之一。
發明內容
有鑒于此,本發明提供一種情感原因對抽取模型的訓練方法、裝置、設備及介質,用以確定文本中的情感子句和指向情感子句的原因子句。
第一方面,本發明實施例提供一種情感原因對抽取模型的訓練方法,包括:
將文檔樣本輸入至所述第一編碼網絡,得到文檔樣本中每個子句的情感子句表示和每個子句的原因子句表示;
基于第二編碼網絡,根據每個所述子句的情感子句表示和原因子句表示,得到每個所述子句的第一情感子句預測結果和第一原因子句預測結果,并得到每個所述子句的情感輸出和每個所述子句的原因輸出,其中,所述每個所述子句的情感輸出通過子句的第一原因子句預測結果和情感子句表示得到,所述每個所述子句的原因輸出通過子句的第一情感子句預測結果和原因子句表示得到;
將每個所述子句的情感輸出和原因輸出輸入至圖注意力網絡,得到每個所述子句更新后的情感輸出和更新后的原因輸出,其中,所述圖注意力網絡用于根據每個所述子句的情感輸出和原因輸出,更新每個所述子句的情感輸出和原因輸出;
基于所述配對網絡,根據每個所述子句更新后的情感輸出得到每個所述子句的情感表示,及根據每個所述子句更新后的原因輸出得到每個所述子句的原因表示,并將所有所述子句的情感表示和原因表示兩兩配對,得到情感原因對;
將所有所述情感原因對輸入至預測網絡,得到情感原因對預測結果;
根據第一預設算式,得到所述情感原因對預測結果對應的情感原因對預測損失值,并利用所述情感原因對預測損失值更新所述情感原因對抽取模型。
可選的,在本發明實施例提供的一種實施方式中,所述圖注意力網絡包含依次相連的預設數量層圖注意力層,第一層圖注意力層用于更新每個所述子句的情感輸出和原因輸出,圖注意力網絡的其余每層所述圖注意力層均用于更新上一個圖注意力層的情感輸出和原因輸出。
可選的,在本發明實施例提供的一種實施方式中,所述基于所述配對網絡,根據每個所述子句更新后的情感輸出得到每個所述子句的情感表示,及根據每個所述子句更新后的原因輸出得到每個所述子句的原因表示,包括:
將每個所述子句更新后的情感輸出輸入至所述配對網絡的第二預設算式,得到情感表示,及將每個所述子句更新后的原因輸出輸入至所述配對網絡的第三預設算式,得到原因表示;
所述第二預設算式包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210039899.2/2.html,轉載請聲明來源鉆瓜專利網。





