[發明專利]對話模型訓練、對話生成方法、系統、計算機和存儲介質在審
| 申請號: | 202111338580.1 | 申請日: | 2021-11-12 |
| 公開(公告)號: | CN114090751A | 公開(公告)日: | 2022-02-25 |
| 發明(設計)人: | 劉偉碩 | 申請(專利權)人: | 北京明略軟件系統有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/338;G06K9/62;G06N20/00 |
| 代理公司: | 青島清泰聯信知識產權代理有限公司 37256 | 代理人: | 欒瑜 |
| 地址: | 100089 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對話 模型 訓練 生成 方法 系統 計算機 存儲 介質 | ||
本申請涉及一種對話模型訓練、對話生成方法、系統、計算機和存儲介質,其中,對話模型包括生成器和判別器,該對話模型訓練方法包括:數據集獲取步驟,獲取包括樣本語句及其真實回復語句的訓練數據集;判別器訓練步驟,將樣本語句輸入生成器生成偽造回復語句,將其結合真實回復語句構造判別器訓練集后,輸入判別器判別是否真實;生成器訓練優化步驟,獲取判別器訓練步驟的判別結果,基于判別器的判別結果抑制或放大樣本的損失數值,直至生成器的損失函數不再下降;交替訓練步驟,交替執行生成器訓練優化步驟或判別器訓練步驟,直至判別器及生成器的損失函數均不再下降。通過本申請,提高對話模型的魯棒性和準確率,提高對話生成的準確率。
技術領域
本申請涉及計算機技術領域,特別是涉及一種基于生成式對抗網絡的對話模型訓練、對話生成方法、系統、計算機設備和計算機可讀存儲介質。
背景技術
對話系統或對話代理(Dialogue system)是旨在與人對話的計算機系統。對話系統采用文本,語音,圖形,觸覺,手勢和其他模式中的一種或多種在輸入和輸出通道上進行通信。對話生成(Dialogue generation)是對話系統中的一個核心算法和功能模塊。
目前生成式對話主要包括兩種實現方案:基于pipeline的方法和基于深度學習網絡的方法。其中,基于pipeline的對話生成方法主要包括:自然語言理解、對話狀態管理、自然語言生成三個部分,由于基于pipeline模型的整體表現受制于所有的部分,所以模型的泛化能力較差。而基于深度學習網絡的多輪對話生成方式主要受限于對往輪對話信息的存儲和利用,隨著對話輪數的增加背景信息也隨之增加,而且對話的方式和序列長度等基本信息都不受控制,對對話系統存儲能力的需求較高。
發明內容
本申請實施例提供了一種基于生成式對抗網絡的對話模型訓練、對話生成方法、系統、計算機設備和計算機可讀存儲介質,提高對話模型的魯棒性和準確率,提高對話生成的準確率。
第一方面,本申請實施例提供了一種對話模型訓練方法,所述對話模型包括生成器和判別器,所述方法包括:
數據集獲取步驟,獲取訓練數據集,所述訓練數據集包括若干由樣本語句及其真實回復語句組成的真實語句對;
判別器訓練步驟,通過一樣本選擇器將所述樣本語句輸入所述生成器生成偽造回復語句,基于所述偽造回復語句及真實回復語句構造判別器訓練集后,輸入所述判別器判別是否真實;
生成器訓練優化步驟,獲取所述判別器訓練步驟的判別結果,基于所述判別器的判別結果抑制或放大所述判別結果對應樣本的損失數值,直至所述生成器的損失函數不再下降;
交替訓練步驟,以所述判別器的損失函數或所述生成器的損失函數不在下降作為交替條件,交替執行所述生成器訓練優化步驟或所述判別器訓練步驟,直至所述判別器及生成器的損失函數均不再下降。
通過上述步驟,本申請使用生成式對抗網絡的方式訓練對話生成模型,從自然語言理解的角度增加該對話模型的魯棒性和準確率,相比于普通的單一模型訓練方式提高了模型訓練的難度,使得模型進一步去擬合真實回復的語言特征,進一步使模型生成的對話具有真實性。
在其中一些實施例中,所述判別器訓練步驟進一步包括:
偽造回復獲取步驟,通過所述樣本選擇器抽取所述樣本語句輸入至所述生成器,通過所述生成器生成偽造回復語句;需要說明的是,此時的所述生成器是初始階段使用、未經優化訓練的。
判別器訓練集獲取步驟,抽取一設定比例的所述真實回復語句,利用所述真實回復語句和所述偽造回復語句構建判別器訓練集;
判別器訓練步驟,輸入所述判別器訓練集至所述判別器,所述判別器判別所述判別器訓練集中語句為真實或偽造;也即判別是否為來自訓練數據集的真實回復語句或生成器輸出的偽造回復語句;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京明略軟件系統有限公司,未經北京明略軟件系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111338580.1/2.html,轉載請聲明來源鉆瓜專利網。





