[發(fā)明專利]一種對話處理方法及相關(guān)設(shè)備在審
| 申請?zhí)枺?/td> | 202111542344.1 | 申請日: | 2021-12-13 |
| 公開(公告)號: | CN114201974A | 公開(公告)日: | 2022-03-18 |
| 發(fā)明(設(shè)計)人: | 李娜;郝怡;李凱強;李勇 | 申請(專利權(quán))人: | 國網(wǎng)電子商務有限公司;國網(wǎng)電商科技有限公司 |
| 主分類號: | G06F40/35 | 分類號: | G06F40/35;G06N20/00 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 李慧慧 |
| 地址: | 100053 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 對話 處理 方法 相關(guān) 設(shè)備 | ||
本發(fā)明公開了一種對話處理方法及相關(guān)設(shè)備,可以獲得一句待回復文本,利用訓練好的Seq2Seq模型和訓練好的目標強化學習模型對待回復文本進行處理,獲得目標強化學習模型輸出的與待回復文本相匹配的目標回復文本,目標回復文本有利于推動對話持續(xù)進行。本發(fā)明可以在進行人機對話時,有效避免萬能回復和陷入死循環(huán)等問題,有效推動與用戶的多輪對話,使得對話可以有效的持續(xù)下去。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機科學與技術(shù)領(lǐng)域,尤其涉及一種對話處理方法及相關(guān)設(shè)備。
背景技術(shù)
隨著計算機科學與技術(shù)的發(fā)展,機器學習技術(shù)不斷提高。
Seq2Seq模型為基于循環(huán)神經(jīng)網(wǎng)絡生成的機器學習模型,可以用于自然語言處理,進行人機對話。需要說明的是,Seq2Seq模型可以主要包括編碼器和解碼器兩部分。現(xiàn)有技術(shù)可以將Seq2Seq模型應用在人機對話生成任務中,對用戶詢問的問題或者輸入的信息生成響應文本并進行回復。
但是,現(xiàn)有技術(shù)在與用戶進行多輪對話時,容易產(chǎn)生萬能回復、陷入死循環(huán)等問題,無法有效的與用戶進行多輪對話。
發(fā)明內(nèi)容
鑒于上述問題,本發(fā)明提供一種克服上述問題或者至少部分地解決上述問題的對話處理方法及相關(guān)設(shè)備,技術(shù)方案如下:
一種對話處理方法,包括:
獲得一句待回復文本;
利用訓練好的Seq2Seq模型和訓練好的目標強化學習模型對所述待回復文本進行處理,獲得所述目標強化學習模型輸出的與所述待回復文本相匹配的目標回復文本,所述目標回復文本有利于推動對話持續(xù)進行。
可選的,所述利用訓練好的Seq2Seq模型和訓練好的目標強化學習模型對所述待回復文本進行處理,包括:
將所述待回復文本輸入至所述Seq2Seq模型;
獲得所述Seq2Seq模型輸出的第一文本信息;
將所述第一文本信息輸入至所述目標強化學習模型進行處理。
可選的,所述目標強化學習模型基于所述第一文本信息確定至少一條候選回復文本,對各所述候選回復文本的對話推動收益進行評估,將對話推動收益最大的所述候選回復文本確定為所述目標回復文本。
一種對話處理裝置,包括:第一獲得單元、第一處理單元和第二獲得單元;其中:
所述第一獲得單元,用于獲得一句待回復文本;
所述第一處理單元,用于利用訓練好的Seq2Seq模型和訓練好的目標強化學習模型對所述待回復文本進行處理;
所述第二獲得單元,用于所述目標回復文本有利于推動對話持續(xù)進行。
可選的,所述第一處理單元包括:第一輸入單元、第三獲得單元和第二輸入單元;
所述第一輸入單元,用于將所述待回復文本輸入至所述Seq2Seq模型;
所述第三獲得單元,用于獲得所述Seq2Seq模型輸出的第一文本信息;
所述第二輸入單元,用于將所述第一文本信息輸入至所述目標強化學習模型進行處理。
可選的,所述目標強化學習模型基于所述第一文本信息確定至少一條候選回復文本,對各所述候選回復文本的對話推動收益進行評估,將對話推動收益最大的所述候選回復文本確定為所述目標回復文本。
一種計算機可讀介質(zhì),其上存儲有計算機程序,其中,所述程序被處理器執(zhí)行時實現(xiàn)上述任一對話處理方法。
一種處理器,所述處理器用于運行程序,其中,所述程序運行時實現(xiàn)上述任一對話處理方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)電子商務有限公司;國網(wǎng)電商科技有限公司,未經(jīng)國網(wǎng)電子商務有限公司;國網(wǎng)電商科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111542344.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種單晶硅中子輻照裝置及方法
- 下一篇:一種泄漏檢測方法及系統(tǒng)





