[發明專利]神經網絡的訓練、對話生成方法及裝置、存儲介質在審
| 申請號: | 202010620299.6 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111783955A | 公開(公告)日: | 2020-10-16 |
| 發明(設計)人: | 章學妙;曹陽 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06F16/332;G06F16/35 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 靳玫 |
| 地址: | 100080 北京市海淀區北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 訓練 對話 生成 方法 裝置 存儲 介質 | ||
1.一種神經網絡的訓練方法,其特征在于,所述神經網絡包括生成器模塊以及多個判別器模塊,其中,多個判別器模塊對應不同優化目標,所述方法包括:
將樣本查詢語句輸入所述生成器模塊,得到第一回復語句;
在所述多個判別器模塊中,確定第一輪對抗訓練采用的第一判別器模塊;
獲取與所述樣本查詢語句對應的樣本回復語句,并根據所述樣本回復語句和所述第一回復語句,確定所述第一判別器模塊在對應的第一優化目標上產生的第一獎勵信號;
在所述第一輪對抗訓練中,根據所述樣本回復語句、所述第一回復語句、所述第一獎勵信號,對所述神經網絡進行訓練。
2.根據權利要求1所述的方法,其特征在于,所述在所述第一輪對抗訓練中,根據所述樣本回復語句、所述第一回復語句、所述第一獎勵信號,對所述神經網絡進行訓練,包括如下至少一項:
在所述第一輪對抗訓練中,根據所述第一獎勵信號,對所述生成器模塊進行訓練;
在所述第一輪對抗訓練中,根據所述樣本回復語句和所述第一回復語句,對所述第一判別器模塊進行訓練。
3.根據權利要求1或2所述的方法,其特征在于,所述將樣本查詢語句輸入所述生成器模塊,得到第一回復語句,包括:
通過疊加的多層長短期記憶網絡對輸入的所述樣本查詢語句進行編碼,得到與所述樣本查詢語句對應的至少一個隱狀態向量;
再通過疊加的多層長短期記憶網絡對與所述樣本查詢語句對應的至少一個隱狀態向量進行解碼后,得到所述第一回復語句。
4.根據權利要求1-3任一項所述的方法,其特征在于,所述多個判別器模塊對應的采樣概率值滿足采樣分布函數;
所述在所述多個判別器模塊中,確定第一輪對抗訓練采用的第一判別器模塊,包括:
根據所述采樣分布函數,將所述多個判別器模塊中所述采樣概率值最大的判別器模塊作為所述第一判別器模塊。
5.根據權利要求1-4任一項所述的方法,其特征在于,所述根據所述樣本回復語句和所述第一回復語句,確定所述第一判別器模塊在對應的第一優化目標上產生的第一獎勵信號,包括:
通過第一判別器模塊從所述樣本回復語句和所述第一回復語句中提取與所述第一優化目標對應的特征信息;
根據與所述第一優化目標對應的所述特征信息,確定所述第一回復語句在所述第一優化目標上取得的第一分值;
在所述第一輪對抗訓練中,將所述第一分值的變化量作為所述第一獎勵信號對應的數值。
6.根據權利要求5所述的方法,其特征在于,所述第一優化目標包括語言優化目標;
所述通過第一判別器模塊從所述樣本回復語句和所述第一回復語句中提取與所述第一優化目標對應的特征信息,包括:
通過疊加的多層長短期記憶網絡從所述樣本回復語句和所述第一回復語句中提取與所述語言優化目標對應的語言特征信息;
所述根據與所述第一優化目標對應的所述特征信息,確定所述第一回復語句在所述第一優化目標上取得的第一分值,包括:
通過二分類判別器對從所述樣本回復語句和所述第一回復語句中提取的所述語言特征信息進行分類,得到分類結果;
將所述分類結果為真值的所述語言特征信息的概率值作為所述第一回復語句在所述語言優化目標上取得的所述第一分值。
7.根據權利要求5所述的方法,其特征在于,所述第一優化目標包括語法優化目標;
所述通過第一判別器模塊從所述樣本回復語句和所述第一回復語句中提取與所述第一優化目標對應的特征信息,包括:
通過預先訓練好的語法圖卷積神經網絡,從所述樣本回復語句和所述第一回復語句中提取與所述語法優化目標對應的語法特征信息;
所述根據與所述第一優化目標對應的所述特征信息,確定所述第一回復語句在所述第一優化目標上取得的第一分值,包括:
對從所述樣本回復語句和所述第一回復語句中提取的所述語法特征信息依次進行批正則化處理和線性回歸處理,確定所述第一回復語句在所述語法優化目標上取得的所述第一分值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010620299.6/1.html,轉載請聲明來源鉆瓜專利網。





