[發(fā)明專利]對(duì)話生成模型訓(xùn)練、對(duì)話回復(fù)生成方法和裝置以及介質(zhì)在審

申請(qǐng)?zhí)枺?/td>	202210059369.4	申請(qǐng)日：	2022-01-19
公開（公告）號(hào)：	CN114416949A	公開（公告）日：	2022-04-29
發(fā)明（設(shè)計(jì)）人：	李浩然	申請(qǐng)（專利權(quán)）人：	北京京東尚科信息技術(shù)有限公司
主分類號(hào)：	G06F16/332	分類號(hào)：	G06F16/332;G06F16/33;G06F16/338
代理公司：	中國(guó)貿(mào)促會(huì)專利商標(biāo)事務(wù)所有限公司 11038	代理人：	方亮
地址：	100086 ***	國(guó)省代碼：	北京;11
權(quán)利要求書：	查看更多	說(shuō)明書：	查看更多
摘要：
搜索關(guān)鍵詞：	對(duì)話生成模型訓(xùn)練回復(fù) 方法裝置以及介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【說(shuō)明書】：

本公開提供了一種對(duì)話生成模型訓(xùn)練、對(duì)話回復(fù)生成方法和裝置以及存儲(chǔ)介質(zhì)，其中的方法包括：基于歷史輪次提問(wèn)信息和當(dāng)前提問(wèn)信息生成訓(xùn)練樣本，使用對(duì)話生成模型對(duì)訓(xùn)練樣本進(jìn)行處理，確定歷史輪次提問(wèn)信息與當(dāng)前提問(wèn)信息相對(duì)應(yīng)的重要性評(píng)分，根據(jù)重要性評(píng)分確定與當(dāng)前輪次提問(wèn)信息相對(duì)應(yīng)的目標(biāo)詞生成概率；基于目標(biāo)詞生成概率生成與當(dāng)前提問(wèn)信息相對(duì)應(yīng)的回復(fù)預(yù)測(cè)信息；根據(jù)回復(fù)預(yù)測(cè)信息確定損失函數(shù)，基于損失函數(shù)對(duì)對(duì)話生成模型進(jìn)行調(diào)整處理。本公開的方法和裝置以及存儲(chǔ)介質(zhì)，采用層次化注意力機(jī)制對(duì)歷史輪次對(duì)話信息進(jìn)行加權(quán)處理，提高了相關(guān)的歷史輪次對(duì)話信息與當(dāng)前輪次對(duì)話的提問(wèn)信息之間的權(quán)重，提升當(dāng)前輪次回復(fù)的生成質(zhì)量。

技術(shù)領(lǐng)域

本發(fā)明涉及人工智能技術(shù)領(lǐng)域，尤其涉及一種對(duì)話生成模型訓(xùn)練、對(duì)話回復(fù)生成方法和裝置以及存儲(chǔ)介質(zhì)。

背景技術(shù)

對(duì)話生成任務(wù)是根據(jù)對(duì)話歷史和當(dāng)前輪次的提問(wèn)，生成回復(fù)的任務(wù)。對(duì)話歷史通常由多輪對(duì)話構(gòu)成，每輪對(duì)話由提問(wèn)和回復(fù)構(gòu)成。在現(xiàn)有的對(duì)話生成模型訓(xùn)練過(guò)程中，輸入是將對(duì)話歷史中的每一輪的提問(wèn)和回復(fù)拼接為一段長(zhǎng)文本，未對(duì)每一個(gè)輪次的提問(wèn)和回復(fù)進(jìn)行區(qū)分對(duì)待。在實(shí)際的應(yīng)用中，每一輪的提問(wèn)和回復(fù)的重要性不同，重要的提問(wèn)和回復(fù)對(duì)當(dāng)前的回復(fù)生成能夠起到正面作用，與當(dāng)前的回復(fù)生成無(wú)關(guān)的提問(wèn)和回復(fù)是噪音信息，會(huì)影響當(dāng)前的回復(fù)生成的準(zhǔn)確性。

發(fā)明內(nèi)容

有鑒于此，本發(fā)明要解決的一個(gè)技術(shù)問(wèn)題是提供一種對(duì)話生成模型訓(xùn)練、對(duì)話回復(fù)生成方法和裝置以及存儲(chǔ)介質(zhì)。

根據(jù)本公開的第一方面，提供一種對(duì)話生成模型訓(xùn)練方法，包括：根據(jù)歷史對(duì)話信息中的提問(wèn)信息和回復(fù)信息，生成與所述歷史對(duì)話信息相對(duì)應(yīng)的歷史輪次提問(wèn)信息；基于所述歷史輪次提問(wèn)信息和當(dāng)前提問(wèn)信息生成訓(xùn)練樣本；使用對(duì)話生成模型對(duì)所述訓(xùn)練樣本進(jìn)行處理，確定所述歷史輪次提問(wèn)信息與所述當(dāng)前提問(wèn)信息相對(duì)應(yīng)的重要性評(píng)分；根據(jù)所述重要性評(píng)分確定注意力權(quán)重，使用所述對(duì)話生成模型并根據(jù)所述注意力權(quán)重，確定與所述當(dāng)前輪次提問(wèn)信息相對(duì)應(yīng)的目標(biāo)詞生成概率；基于所述目標(biāo)詞生成概率生成與所述當(dāng)前提問(wèn)信息相對(duì)應(yīng)的回復(fù)預(yù)測(cè)信息；根據(jù)所述回復(fù)預(yù)測(cè)信息確定損失函數(shù)，基于所述損失函數(shù)對(duì)所述對(duì)話生成模型進(jìn)行調(diào)整處理。

可選地，所述使用對(duì)話生成模型對(duì)所述訓(xùn)練樣本進(jìn)行處理，確定所述歷史輪次提問(wèn)信息與所述當(dāng)前提問(wèn)信息相對(duì)應(yīng)的重要性評(píng)分包括：使用提問(wèn)分割符和回復(fù)隔離符對(duì)所述訓(xùn)練樣本中的提問(wèn)信息和回復(fù)信息進(jìn)行隔離處理；使用所述對(duì)話生成模型的編碼器對(duì)所述歷史輪次提問(wèn)信息進(jìn)行編碼處理，獲得與所述歷史輪次提問(wèn)信息相對(duì)應(yīng)的編碼隱層狀態(tài)信息；根據(jù)所述編碼隱層狀態(tài)信息，獲得所述當(dāng)前提問(wèn)信息與所述歷史輪次提問(wèn)信息之間的重要性評(píng)分。

可選地，所述編碼隱層狀態(tài)信息包括：提問(wèn)編碼隱層狀態(tài)信息和回復(fù)編碼隱層狀態(tài)信息；所述根據(jù)所述編碼隱層狀態(tài)信息，獲得所述當(dāng)前提問(wèn)信息與所述歷史輪次提問(wèn)信息之間的重要性評(píng)分包括：使用所述對(duì)話生成模型的第一激勵(lì)函數(shù)，獲得與所述提問(wèn)編碼隱層狀態(tài)信息相對(duì)應(yīng)的第一激勵(lì)函數(shù)值；使用所述第一激勵(lì)函數(shù)，獲得與所述回復(fù)編碼隱層狀態(tài)信息相對(duì)應(yīng)的第二激勵(lì)函數(shù)值；基于所述第一激勵(lì)函數(shù)值、所述第二激勵(lì)函數(shù)值以及所述第二激活函數(shù)，獲得所述重要性評(píng)分。

可選地，所述根據(jù)所述重要性評(píng)分確定注意力權(quán)重包括：確定所述歷史輪次提問(wèn)信息的初始權(quán)重；將所述初始權(quán)重與對(duì)應(yīng)的重要性評(píng)分的乘積，作為新權(quán)重；對(duì)全部歷史輪次提問(wèn)信息的新權(quán)重進(jìn)行求和，獲得所述注意力權(quán)重。

可選地，所述確定所述歷史輪次提問(wèn)信息的初始權(quán)重包括：使用所述對(duì)話生成模型的第三激活函數(shù)，獲得與所述歷史輪次提問(wèn)信息相對(duì)應(yīng)的第三激勵(lì)函數(shù)值；基于所述第三激勵(lì)函數(shù)值以及所述第二激活函數(shù)，獲得所述初始權(quán)重。

可選地，所述使用所述對(duì)話生成模型并根據(jù)所述注意力權(quán)重，確定與所述當(dāng)前輪次提問(wèn)信息相對(duì)應(yīng)的目標(biāo)詞生成概率包括：使用所述對(duì)話生成模型的解碼器并根據(jù)所述注意力權(quán)重進(jìn)行解碼處理，獲得與所述當(dāng)前輪次提問(wèn)信息相對(duì)應(yīng)的解碼隱層狀態(tài)信息；基于所述解碼隱層狀態(tài)信息以及所述第二激活函數(shù)，獲得所述目標(biāo)詞生成概率。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司，未經(jīng)北京京東尚科信息技術(shù)有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210059369.4/2.html，轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

滑坡模型實(shí)驗(yàn)?zāi)Ｐ图?/a>

專利文獻(xiàn)下載

說(shuō)明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】