[發(fā)明專利]對(duì)話生成模型訓(xùn)練、對(duì)話回復(fù)生成方法和裝置以及介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202210059369.4 | 申請(qǐng)日: | 2022-01-19 |
| 公開(公告)號(hào): | CN114416949A | 公開(公告)日: | 2022-04-29 |
| 發(fā)明(設(shè)計(jì))人: | 李浩然 | 申請(qǐng)(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F16/33;G06F16/338 |
| 代理公司: | 中國(guó)貿(mào)促會(huì)專利商標(biāo)事務(wù)所有限公司 11038 | 代理人: | 方亮 |
| 地址: | 100086 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 對(duì)話 生成 模型 訓(xùn)練 回復(fù) 方法 裝置 以及 介質(zhì) | ||
本公開提供了一種對(duì)話生成模型訓(xùn)練、對(duì)話回復(fù)生成方法和裝置以及存儲(chǔ)介質(zhì),其中的方法包括:基于歷史輪次提問(wèn)信息和當(dāng)前提問(wèn)信息生成訓(xùn)練樣本,使用對(duì)話生成模型對(duì)訓(xùn)練樣本進(jìn)行處理,確定歷史輪次提問(wèn)信息與當(dāng)前提問(wèn)信息相對(duì)應(yīng)的重要性評(píng)分,根據(jù)重要性評(píng)分確定與當(dāng)前輪次提問(wèn)信息相對(duì)應(yīng)的目標(biāo)詞生成概率;基于目標(biāo)詞生成概率生成與當(dāng)前提問(wèn)信息相對(duì)應(yīng)的回復(fù)預(yù)測(cè)信息;根據(jù)回復(fù)預(yù)測(cè)信息確定損失函數(shù),基于損失函數(shù)對(duì)對(duì)話生成模型進(jìn)行調(diào)整處理。本公開的方法和裝置以及存儲(chǔ)介質(zhì),采用層次化注意力機(jī)制對(duì)歷史輪次對(duì)話信息進(jìn)行加權(quán)處理,提高了相關(guān)的歷史輪次對(duì)話信息與當(dāng)前輪次對(duì)話的提問(wèn)信息之間的權(quán)重,提升當(dāng)前輪次回復(fù)的生成質(zhì)量。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種對(duì)話生成模型訓(xùn)練、對(duì)話回復(fù)生成方法和裝置以及存儲(chǔ)介質(zhì)。
背景技術(shù)
對(duì)話生成任務(wù)是根據(jù)對(duì)話歷史和當(dāng)前輪次的提問(wèn),生成回復(fù)的任務(wù)。對(duì)話歷史通常由多輪對(duì)話構(gòu)成,每輪對(duì)話由提問(wèn)和回復(fù)構(gòu)成。在現(xiàn)有的對(duì)話生成模型訓(xùn)練過(guò)程中,輸入是將對(duì)話歷史中的每一輪的提問(wèn)和回復(fù)拼接為一段長(zhǎng)文本,未對(duì)每一個(gè)輪次的提問(wèn)和回復(fù)進(jìn)行區(qū)分對(duì)待。在實(shí)際的應(yīng)用中,每一輪的提問(wèn)和回復(fù)的重要性不同,重要的提問(wèn)和回復(fù)對(duì)當(dāng)前的回復(fù)生成能夠起到正面作用,與當(dāng)前的回復(fù)生成無(wú)關(guān)的提問(wèn)和回復(fù)是噪音信息,會(huì)影響當(dāng)前的回復(fù)生成的準(zhǔn)確性。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明要解決的一個(gè)技術(shù)問(wèn)題是提供一種對(duì)話生成模型訓(xùn)練、對(duì)話回復(fù)生成方法和裝置以及存儲(chǔ)介質(zhì)。
根據(jù)本公開的第一方面,提供一種對(duì)話生成模型訓(xùn)練方法,包括:根據(jù)歷史對(duì)話信息中的提問(wèn)信息和回復(fù)信息,生成與所述歷史對(duì)話信息相對(duì)應(yīng)的歷史輪次提問(wèn)信息;基于所述歷史輪次提問(wèn)信息和當(dāng)前提問(wèn)信息生成訓(xùn)練樣本;使用對(duì)話生成模型對(duì)所述訓(xùn)練樣本進(jìn)行處理,確定所述歷史輪次提問(wèn)信息與所述當(dāng)前提問(wèn)信息相對(duì)應(yīng)的重要性評(píng)分;根據(jù)所述重要性評(píng)分確定注意力權(quán)重,使用所述對(duì)話生成模型并根據(jù)所述注意力權(quán)重,確定與所述當(dāng)前輪次提問(wèn)信息相對(duì)應(yīng)的目標(biāo)詞生成概率;基于所述目標(biāo)詞生成概率生成與所述當(dāng)前提問(wèn)信息相對(duì)應(yīng)的回復(fù)預(yù)測(cè)信息;根據(jù)所述回復(fù)預(yù)測(cè)信息確定損失函數(shù),基于所述損失函數(shù)對(duì)所述對(duì)話生成模型進(jìn)行調(diào)整處理。
可選地,所述使用對(duì)話生成模型對(duì)所述訓(xùn)練樣本進(jìn)行處理,確定所述歷史輪次提問(wèn)信息與所述當(dāng)前提問(wèn)信息相對(duì)應(yīng)的重要性評(píng)分包括:使用提問(wèn)分割符和回復(fù)隔離符對(duì)所述訓(xùn)練樣本中的提問(wèn)信息和回復(fù)信息進(jìn)行隔離處理;使用所述對(duì)話生成模型的編碼器對(duì)所述歷史輪次提問(wèn)信息進(jìn)行編碼處理,獲得與所述歷史輪次提問(wèn)信息相對(duì)應(yīng)的編碼隱層狀態(tài)信息;根據(jù)所述編碼隱層狀態(tài)信息,獲得所述當(dāng)前提問(wèn)信息與所述歷史輪次提問(wèn)信息之間的重要性評(píng)分。
可選地,所述編碼隱層狀態(tài)信息包括:提問(wèn)編碼隱層狀態(tài)信息和回復(fù)編碼隱層狀態(tài)信息;所述根據(jù)所述編碼隱層狀態(tài)信息,獲得所述當(dāng)前提問(wèn)信息與所述歷史輪次提問(wèn)信息之間的重要性評(píng)分包括:使用所述對(duì)話生成模型的第一激勵(lì)函數(shù),獲得與所述提問(wèn)編碼隱層狀態(tài)信息相對(duì)應(yīng)的第一激勵(lì)函數(shù)值;使用所述第一激勵(lì)函數(shù),獲得與所述回復(fù)編碼隱層狀態(tài)信息相對(duì)應(yīng)的第二激勵(lì)函數(shù)值;基于所述第一激勵(lì)函數(shù)值、所述第二激勵(lì)函數(shù)值以及所述第二激活函數(shù),獲得所述重要性評(píng)分。
可選地,所述根據(jù)所述重要性評(píng)分確定注意力權(quán)重包括:確定所述歷史輪次提問(wèn)信息的初始權(quán)重;將所述初始權(quán)重與對(duì)應(yīng)的重要性評(píng)分的乘積,作為新權(quán)重;對(duì)全部歷史輪次提問(wèn)信息的新權(quán)重進(jìn)行求和,獲得所述注意力權(quán)重。
可選地,所述確定所述歷史輪次提問(wèn)信息的初始權(quán)重包括:使用所述對(duì)話生成模型的第三激活函數(shù),獲得與所述歷史輪次提問(wèn)信息相對(duì)應(yīng)的第三激勵(lì)函數(shù)值;基于所述第三激勵(lì)函數(shù)值以及所述第二激活函數(shù),獲得所述初始權(quán)重。
可選地,所述使用所述對(duì)話生成模型并根據(jù)所述注意力權(quán)重,確定與所述當(dāng)前輪次提問(wèn)信息相對(duì)應(yīng)的目標(biāo)詞生成概率包括:使用所述對(duì)話生成模型的解碼器并根據(jù)所述注意力權(quán)重進(jìn)行解碼處理,獲得與所述當(dāng)前輪次提問(wèn)信息相對(duì)應(yīng)的解碼隱層狀態(tài)信息;基于所述解碼隱層狀態(tài)信息以及所述第二激活函數(shù),獲得所述目標(biāo)詞生成概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210059369.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種方便取物的上床下桌式公寓床
- 下一篇:履帶車輛
- 對(duì)話控制裝置、對(duì)話控制方法以及記錄介質(zhì)
- 任務(wù)對(duì)話系統(tǒng)中的對(duì)話處理方法及裝置
- 一種人機(jī)對(duì)話的方法、裝置和存儲(chǔ)介質(zhì)
- 對(duì)話(中)獎(jiǎng)勵(lì)評(píng)估和對(duì)話方法、介質(zhì)、裝置和計(jì)算設(shè)備
- 一種對(duì)話方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種輔助英文對(duì)話的方法及系統(tǒng)
- 一種回復(fù)對(duì)話評(píng)分模型訓(xùn)練方法、對(duì)話回復(fù)方法及其裝置
- 一種多輪對(duì)話的問(wèn)題定位方法及裝置
- 文本對(duì)話方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 對(duì)話型文本分類方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)





