[發(fā)明專利]修正自然語言生成結(jié)果的方法和裝置有效
| 申請?zhí)枺?/td> | 202010631294.3 | 申請日: | 2020-07-03 |
| 公開(公告)號: | CN111737417B | 公開(公告)日: | 2020-11-17 |
| 發(fā)明(設(shè)計)人: | 李揚名;姚開盛;李小龍 | 申請(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332 |
| 代理公司: | 北京億騰知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11309 | 代理人: | 陳霽;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 修正 自然語言 生成 結(jié)果 方法 裝置 | ||
本說明書實施例提供一種修正自然語言生成結(jié)果的方法和裝置。方法包括:首先獲取本輪迭代中待修正的第一模板句子,該句子是針對對話動作而生成,該對話動作包括若干詞槽。將第一模板句子輸入指針改寫器,指針改寫器依次逐個確定待輸出句子中各個輸出位置的字符,從而生成修正的第二模板句子。然后對第二模板句子進(jìn)行詞槽提取,并判斷所提取的詞槽與若干詞槽是否一致。若不一致,將第二模板句子確定為下一輪迭代的輸入,并基于對話動作和該第二模板句子生成一條訓(xùn)練樣本,添加到樣本緩存器中。樣本緩存器用于收集訓(xùn)練樣本,所收集的訓(xùn)練樣本用以訓(xùn)練指針改寫器。
技術(shù)領(lǐng)域
本說明書一個或多個實施例涉及機(jī)器學(xué)習(xí)領(lǐng)域,尤其涉及自然語言生成,以及修改自然語言生成結(jié)果的方法和裝置。
背景技術(shù)
隨著人工智能和機(jī)器學(xué)習(xí)的快速發(fā)展,各種自然語言處理任務(wù)已廣泛應(yīng)用于多種業(yè)務(wù)實施場景。在例如智能客服,自動播報等多種業(yè)務(wù)場景中,會使用自動對話系統(tǒng),生成自然語言的對話語句。
自動對話系統(tǒng)中的核心部件為自然語言生成NLG(Natural LanguageGeneration)系統(tǒng),用于將一種意思表征,也就是對話動作DA(Dialogue Act)轉(zhuǎn)換為自然語言的句子。一般地,對話動作DA中包含動作類型(act type)和一些詞槽-槽值對,其中詞槽(slot)表示信息類型,槽值表示對應(yīng)類型的信息內(nèi)容,而動作類型控制輸出句子的句子風(fēng)格。例如,一個對話動作DA可以是:
Inform(name=ZZ hotel, phone=6788888)
在以上DA中,inform為動作類型,name為一個詞槽,槽值為ZZhotel;phone為另一個詞槽,槽值為6788888。
而NLG系統(tǒng)則用于根據(jù)輸入的對話動作DA,輸出自然語言句子,表達(dá)輸入DA中的核心意思。
已經(jīng)通過多種方式構(gòu)建了一些NLG系統(tǒng)。然而,現(xiàn)有的NLG系統(tǒng)仍然常常出現(xiàn)轉(zhuǎn)換錯誤的情況,例如,遺漏一些詞槽,或者詞槽錯位放置等,并且生成的句子也往往不夠自然流暢。因此,希望能有改進(jìn)的方案,可以對有瑕疵的自然語言生成結(jié)果進(jìn)行修正,從而為對話系統(tǒng)提供更好的自然語句。
發(fā)明內(nèi)容
本說明書一個或多個實施例描述了一種修正自然語言生成結(jié)果的方法和裝置,通過對有誤的模板句子迭代進(jìn)行修正,獲取到滿足詞槽一致性的更為準(zhǔn)確的自然語言生成結(jié)果。
根據(jù)第一方面,提供了一種修正自然語言生成結(jié)果的方法,包括:
獲取本輪迭代中待修正的第一模板句子,所述第一模板句子是針對第一對話動作而生成,所述第一對話動作包括若干詞槽;
將所述第一模板句子輸入指針改寫器,所述指針改寫器依次逐個確定待輸出句子中各個輸出位置的字符,從而生成修正的第二模板句子;其中,對于所述各個輸出位置中任意的第一位置,通過從所述第一模板句子中進(jìn)行復(fù)制的第一方式,或者通過重新生成的第二方式,得到該第一位置的字符;
對所述第二模板句子進(jìn)行詞槽提取,并判斷所提取的詞槽與所述若干詞槽是否一致;
在不一致的情況下,將所述第二模板句子確定為下一輪迭代的輸入,并基于所述第一對話動作和所述第二模板句子生成一條訓(xùn)練樣本,添加到樣本緩存器中,所述樣本緩存器用于收集訓(xùn)練樣本,所收集的訓(xùn)練樣本用以訓(xùn)練所述指針改寫器。
在一個實施例中,獲取本輪迭代中待修正的第一模板句子,具體包括:從自然語言生成NLG系統(tǒng)獲取其針對所述第一對話動作而生成的模板結(jié)果;對所述模板結(jié)果進(jìn)行詞槽提取,并判斷所提取的詞槽與所述若干詞槽是否一致;在不一致的情況下,將所述模板結(jié)果作為所述本輪迭代中待修正的第一模板句子。
在不同例子中,所述NLG系統(tǒng)可以為基于K最近鄰的KNN-NLG系統(tǒng),或者,通過神經(jīng)網(wǎng)絡(luò)實現(xiàn)的NLG系統(tǒng)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010631294.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





