[發明專利]神經網絡的訓練、對話生成方法及裝置、存儲介質在審
| 申請號: | 202010620299.6 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111783955A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 章學妙;曹陽 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06F16/332;G06F16/35 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 靳玫 |
| 地址: | 100080 北京市海淀區北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 訓練 對話 生成 方法 裝置 存儲 介質 | ||
本公開提供了一種神經網絡的訓練、對話生成方法及裝置、存儲介質,其中,神經網絡包括生成器模塊以及多個判別器模塊,其中,多個判別器模塊對應不同優化目標,該方法包括:將樣本查詢語句輸入所述生成器模塊,得到第一回復語句;在所述多個判別器模塊中,確定第一輪對抗訓練采用的第一判別器模塊;獲取與所述樣本查詢語句對應的樣本回復語句,并根據所述樣本回復語句和所述第一回復語句,確定所述第一判別器模塊在對應的第一優化目標上產生的第一獎勵信號;在所述第一輪對抗訓練中,根據所述樣本回復語句、所述第一回復語句、所述第一獎勵信號,對所述神經網絡進行訓練。
技術領域
本公開涉及語言處理領域,尤其涉及一種神經網絡的訓練、對話生成方法及裝置、存儲介質。
背景技術
對話生成是對話系統領域中的重要問題。對話生成模型可以在很多領域有重要應用,如智能聊天機器人回復生成,人機交互等。
實現對話生成的過程是很復雜的,人類的對話語句往往會受到多個方面的影響,比如生成的對話語句是否流暢,是否符合語法規則,是否具有信息含量等多個語言學方面。目前的對話生成模型通過改進細粒度的優化目標,通常只能關注到其中一個方面。
發明內容
本公開提供了一種神經網絡的訓練、對話生成方法及裝置、存儲介質。
根據本公開實施例的第一方面,提供一種神經網絡的訓練方法,所述神經網絡包括生成器模塊以及多個判別器模塊,其中,多個判別器模塊對應不同優化目標,所述方法包括:將樣本查詢語句輸入所述生成器模塊,得到第一回復語句;在所述多個判別器模塊中,確定第一輪對抗訓練采用的第一判別器模塊;獲取與所述樣本查詢語句對應的樣本回復語句,并根據所述樣本回復語句和所述第一回復語句,確定所述第一判別器模塊在對應的第一優化目標上產生的第一獎勵信號;在所述第一輪對抗訓練中,根據所述樣本回復語句、所述第一回復語句、所述第一獎勵信號,對所述神經網絡進行訓練。
在一些可選實施例中,所述在所述第一輪對抗訓練中,根據所述樣本回復語句、所述第一回復語句、所述第一獎勵信號,對所述神經網絡進行訓練,包括如下至少一項:在所述第一輪對抗訓練中,根據所述第一獎勵信號,對所述生成器模塊進行訓練;在所述第一輪對抗訓練中,根據所述樣本回復語句和所述第一回復語句,對所述第一判別器模塊進行訓練。
在一些可選實施例中,所述將樣本查詢語句輸入所述生成器模塊,得到第一回復語句,包括:通過疊加的多層長短期記憶網絡對輸入的所述樣本查詢語句進行編碼,得到與所述樣本查詢語句對應的至少一個隱狀態向量;再通過疊加的多層長短期記憶網絡對與所述樣本查詢語句對應的至少一個隱狀態向量進行解碼后,得到所述第一回復語句。
在一些可選實施例中,所述多個判別器模塊對應的采樣概率值滿足采樣分布函數;所述在所述多個判別器模塊中,確定第一輪對抗訓練采用的第一判別器模塊,包括:根據所述采樣分布函數,將所述多個判別器模塊中所述采樣概率值最大的判別器模塊作為所述第一判別器模塊。
在一些可選實施例中,所述根據所述樣本回復語句和所述第一回復語句,確定所述第一判別器模塊在對應的第一優化目標上產生的第一獎勵信號,包括:通過第一判別器模塊從所述樣本回復語句和所述第一回復語句中提取與所述第一優化目標對應的特征信息;根據與所述第一優化目標對應的所述特征信息,確定所述第一回復語句在所述第一優化目標上取得的第一分值;在所述第一輪對抗訓練中,將所述第一分值相對于第二分值的差值作為所述第一獎勵信號對應的數值;其中,所述第二分值是上一輪對抗訓練中生成器模塊生成的回復語句在所述第一優化目標上取得的分值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010620299.6/2.html,轉載請聲明來源鉆瓜專利網。





