[發(fā)明專利]對話系統(tǒng)獲取方法、裝置、存儲介質(zhì)及計(jì)算機(jī)程序產(chǎn)品有效
| 申請?zhí)枺?/td> | 202011510559.0 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112507104B | 公開(公告)日: | 2022-07-22 |
| 發(fā)明(設(shè)計(jì))人: | 王凡;鮑思琪;何煌;吳華;何徑舟;牛正雨 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權(quán)代理有限公司 11412 | 代理人: | 谷春靜 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 對話 系統(tǒng) 獲取 方法 裝置 存儲 介質(zhì) 計(jì)算機(jī) 程序 產(chǎn)品 | ||
本公開公開了對話系統(tǒng)獲取方法、裝置、存儲介質(zhì)及計(jì)算機(jī)程序產(chǎn)品,涉及智能語音、自然語言處理和深度學(xué)習(xí)等人工智能領(lǐng)域,其中的方法可包括:利用神經(jīng)網(wǎng)絡(luò)模型建模至少兩個(gè)智能體;利用所述至少兩個(gè)智能體組成虛擬交互系統(tǒng);針對任一智能體,分別進(jìn)行以下處理:當(dāng)智能體向其它智能體執(zhí)行交互動(dòng)作后,確定交互動(dòng)作對應(yīng)的獎(jiǎng)勵(lì)值;根據(jù)確定出的獎(jiǎng)勵(lì)值,并以獲得更高獎(jiǎng)勵(lì)值為目標(biāo),持續(xù)訓(xùn)練智能體;當(dāng)訓(xùn)練完成后,將智能體作為用于進(jìn)行人機(jī)對話的對話系統(tǒng)。應(yīng)用本公開所述方案,可提升對話系統(tǒng)的訓(xùn)練效果及對話系統(tǒng)性能等。
技術(shù)領(lǐng)域
本公開涉及人工智能技術(shù)領(lǐng)域,特別涉及智能語音、自然語言處理及深度學(xué)習(xí)領(lǐng)域的對話系統(tǒng)獲取方法、裝置、存儲介質(zhì)及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù)
目前,基于人工智能(AI,Artificial Intelligence)的對話系統(tǒng)受到越來越多的關(guān)注。
傳統(tǒng)的對話系統(tǒng)主要基于人-人對話語料,利用最大似然等目標(biāo)函數(shù)來優(yōu)化模型。但人類和人類的對話往往帶有諸多背景信息,如對話發(fā)生場景、對話雙方的背景、狀態(tài)等。這些信息在人-人對話語料中缺失,很容易導(dǎo)致對話系統(tǒng)的訓(xùn)練被噪聲所左右,從而影響了訓(xùn)練效果等。
發(fā)明內(nèi)容
本公開提供了對話系統(tǒng)獲取方法、裝置、存儲介質(zhì)及計(jì)算機(jī)程序產(chǎn)品。
一種對話系統(tǒng)獲取方法,包括:
利用神經(jīng)網(wǎng)絡(luò)模型建模至少兩個(gè)智能體;
利用所述至少兩個(gè)智能體組成虛擬交互系統(tǒng);
針對任一智能體,分別進(jìn)行以下處理:
當(dāng)所述智能體向自身之外的其它智能體執(zhí)行交互動(dòng)作后,確定所述交互動(dòng)作對應(yīng)的獎(jiǎng)勵(lì)值;
根據(jù)確定出的獎(jiǎng)勵(lì)值,并以獲得更高獎(jiǎng)勵(lì)值為目標(biāo),持續(xù)訓(xùn)練所述智能體;
當(dāng)訓(xùn)練完成后,將所述智能體作為用于進(jìn)行人機(jī)對話的對話系統(tǒng)。
一種對話系統(tǒng)獲取裝置,包括:第一構(gòu)建模塊、第二構(gòu)建模塊以及訓(xùn)練模塊;
所述第一構(gòu)建模塊,用于利用神經(jīng)網(wǎng)絡(luò)模型建模至少兩個(gè)智能體;
所述第二構(gòu)建模塊,用于利用所述至少兩個(gè)智能體組成虛擬交互系統(tǒng);
所述訓(xùn)練模塊,用于針對任一智能體,分別進(jìn)行以下處理:當(dāng)所述智能體向自身之外的其它智能體執(zhí)行交互動(dòng)作后,確定所述交互動(dòng)作對應(yīng)的獎(jiǎng)勵(lì)值;根據(jù)確定出的獎(jiǎng)勵(lì)值,并以獲得更高獎(jiǎng)勵(lì)值為目標(biāo),持續(xù)訓(xùn)練所述智能體;當(dāng)訓(xùn)練完成后,將所述智能體作為用于進(jìn)行人機(jī)對話的對話系統(tǒng)。
一種電子設(shè)備,包括:
至少一個(gè)處理器;以及
與所述至少一個(gè)處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行如以上所述的方法。
一種存儲有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行如以上所述的方法。
一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如以上所述的方法。
上述公開中的一個(gè)實(shí)施例具有如下優(yōu)點(diǎn)或有益效果:可在包括至少兩個(gè)智能體的虛擬交互系統(tǒng)中訓(xùn)練智能體,并可將訓(xùn)練完成的智能體作為用于進(jìn)行人機(jī)對話的對話系統(tǒng),從而無需用到人-人對話語料,避免了現(xiàn)有技術(shù)中的問題,進(jìn)而提升了訓(xùn)練效果及對話系統(tǒng)性能等。
應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011510559.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 對話控制裝置、對話控制方法以及記錄介質(zhì)
- 任務(wù)對話系統(tǒng)中的對話處理方法及裝置
- 一種人機(jī)對話的方法、裝置和存儲介質(zhì)
- 對話(中)獎(jiǎng)勵(lì)評估和對話方法、介質(zhì)、裝置和計(jì)算設(shè)備
- 一種對話方法、裝置、服務(wù)器及存儲介質(zhì)
- 一種輔助英文對話的方法及系統(tǒng)
- 一種回復(fù)對話評分模型訓(xùn)練方法、對話回復(fù)方法及其裝置
- 一種多輪對話的問題定位方法及裝置
- 文本對話方法、裝置、電子設(shè)備及存儲介質(zhì)
- 對話型文本分類方法、系統(tǒng)、設(shè)備及存儲介質(zhì)





