[發(fā)明專利]自然語(yǔ)言生成方法、裝置及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110213834.0 | 申請(qǐng)日: | 2021-02-25 |
| 公開(kāi)(公告)號(hào): | CN114970555A | 公開(kāi)(公告)日: | 2022-08-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉杰;劉琦;王笑;張穗云;張晴 | 申請(qǐng)(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號(hào): | G06F40/35 | 分類號(hào): | G06F40/35;G06F40/284;G06N3/04;G06F16/332 |
| 代理公司: | 北京格羅巴爾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11406 | 代理人: | 孫德崇 |
| 地址: | 518129 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自然語(yǔ)言 生成 方法 裝置 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)涉及一種自然語(yǔ)言生成方法、裝置及存儲(chǔ)介質(zhì),其中,所述方法應(yīng)用于對(duì)話系統(tǒng),所述方法包括:對(duì)系統(tǒng)動(dòng)作文本進(jìn)行編碼,得到編碼向量;對(duì)所述編碼向量進(jìn)行解碼,在解碼過(guò)程中判斷解碼文本是否滿足解碼結(jié)束條件,所述解碼結(jié)束條件為:所述解碼文本中包括所述系統(tǒng)動(dòng)作文本模板中的所有預(yù)設(shè)的所述槽位,或者所述解碼文本中包括所述系統(tǒng)動(dòng)作文本中的所有所述槽位值;在所述解碼文本滿足所述解碼結(jié)束條件的情況下,確定所述解碼文本為用于回復(fù)所述用戶查詢信息的自然語(yǔ)言文本。本申請(qǐng)的實(shí)施例可通過(guò)解碼結(jié)束條件對(duì)解碼過(guò)程進(jìn)行限制,從而能夠避免語(yǔ)義信息丟失,提高自然語(yǔ)言生成的準(zhǔn)確性及穩(wěn)定性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種自然語(yǔ)言生成方法、裝置及存儲(chǔ)介質(zhì)。
背景技術(shù)
任務(wù)型對(duì)話系統(tǒng)作為垂直領(lǐng)域的業(yè)務(wù)助理,可以高效處理繁瑣和重復(fù)的高頻問(wèn)答,繼而完成用戶的目標(biāo)任務(wù),例如訂票、查詢天氣等。
自然語(yǔ)言生成(natural language generation,NLG)是任務(wù)型對(duì)話系統(tǒng)的重要組成部分。自然語(yǔ)言生成旨在將機(jī)器表述系統(tǒng)中的語(yǔ)義表達(dá)(meaning representations,MR)轉(zhuǎn)化為自然語(yǔ)言,以便于人們理解。然而,現(xiàn)有的自然語(yǔ)言生成技術(shù)通常存在語(yǔ)義信息丟失(例如關(guān)鍵詞丟失)的問(wèn)題。
發(fā)明內(nèi)容
有鑒于此,提出了一種自然語(yǔ)言生成方法、裝置及存儲(chǔ)介質(zhì)。
第一方面,本申請(qǐng)的實(shí)施例提供了一種自然語(yǔ)言生成方法,應(yīng)用于對(duì)話系統(tǒng),所述方法包括:對(duì)系統(tǒng)動(dòng)作文本進(jìn)行編碼,得到編碼向量;其中,所述系統(tǒng)動(dòng)作文本是根據(jù)用戶查詢信息和預(yù)設(shè)的系統(tǒng)動(dòng)作文本模板生成的,所述系統(tǒng)動(dòng)作文本模板包括至少一個(gè)預(yù)設(shè)的槽位,所述系統(tǒng)動(dòng)作文本包括至少一個(gè)槽位值;對(duì)所述編碼向量進(jìn)行解碼,在解碼過(guò)程中判斷解碼文本是否滿足解碼結(jié)束條件;其中,所述解碼文本為對(duì)所述編碼向量進(jìn)行解碼得到的文本,所述解碼結(jié)束條件為:所述解碼文本中包括所述系統(tǒng)動(dòng)作文本模板中的所有預(yù)設(shè)的所述槽位,或者所述解碼文本中包括所述系統(tǒng)動(dòng)作文本中的所有所述槽位值;在所述解碼文本滿足所述解碼結(jié)束條件的情況下,確定所述解碼文本為用于回復(fù)所述用戶查詢信息的自然語(yǔ)言文本。
本申請(qǐng)的實(shí)施例的自然語(yǔ)言生成方法,應(yīng)用于對(duì)話系統(tǒng),能夠?qū)Ω鶕?jù)用戶查詢信息和預(yù)設(shè)的系統(tǒng)動(dòng)作文本模板生成的系統(tǒng)動(dòng)作文本進(jìn)行編碼,得到編碼向量,并對(duì)編碼向量進(jìn)行解碼,在解碼過(guò)程中,判斷解碼文本是否滿足解碼結(jié)束條件,解碼結(jié)束條件為解碼文本中包括系統(tǒng)動(dòng)作文本模板中的所有預(yù)設(shè)的槽位或者解碼文本中包括所述系統(tǒng)動(dòng)作文本中的所有所述槽位值;在解碼文本滿足解碼結(jié)束條件的情況下,確定解碼文本為用于回復(fù)用戶查詢信息的自然語(yǔ)言文本,從而使得對(duì)話系統(tǒng)在生成自然語(yǔ)言時(shí),能夠根據(jù)系統(tǒng)動(dòng)作文本中隱含的約束信息(例如包括的槽位值)或者根據(jù)系統(tǒng)動(dòng)作文本模板中隱含的約束信息(例如包括的槽位)對(duì)編碼向量的解碼過(guò)程進(jìn)行指導(dǎo),使得系統(tǒng)動(dòng)作文本中的關(guān)鍵信息在解碼過(guò)程中得到充分的表達(dá),避免語(yǔ)義信息丟失(例如關(guān)鍵詞丟失),進(jìn)而提高自然語(yǔ)言生成的準(zhǔn)確性及穩(wěn)定性。
根據(jù)第一方面,在所述自然語(yǔ)言生成方法的第一種可能的實(shí)現(xiàn)方式中,所述對(duì)系統(tǒng)動(dòng)作文本進(jìn)行編碼,得到編碼向量,具體包括:根據(jù)預(yù)設(shè)詞典對(duì)所述系統(tǒng)動(dòng)作文本中的各個(gè)詞語(yǔ)進(jìn)行編碼,得到詞向量;根據(jù)預(yù)設(shè)短語(yǔ)庫(kù)從所述系統(tǒng)動(dòng)作文本中確定目標(biāo)短語(yǔ),對(duì)所述目標(biāo)短語(yǔ)進(jìn)行編碼,得到短語(yǔ)向量;其中,所述短語(yǔ)庫(kù)包括多個(gè)短語(yǔ),所述目標(biāo)短語(yǔ)為同時(shí)包含于所述短語(yǔ)庫(kù)和所述系統(tǒng)動(dòng)作文本的短語(yǔ);融合所述詞向量和所述短語(yǔ)向量,得到所述編碼向量。
在本實(shí)施例中,通過(guò)將短語(yǔ)向量加入編碼向量,使得編碼向量包括多個(gè)粒度(詞粒度、短語(yǔ)粒度)的向量,從而能夠提高編碼向量對(duì)系統(tǒng)動(dòng)作文本中關(guān)鍵語(yǔ)義信息的表達(dá)的的準(zhǔn)確性,進(jìn)而提高解碼生成的自然語(yǔ)言文本的準(zhǔn)確性及穩(wěn)定性。
根據(jù)第一方面的第一種可能的實(shí)現(xiàn)方式,在所述自然語(yǔ)言生成方法的第二種可能的實(shí)現(xiàn)方式中,所述對(duì)所述目標(biāo)短語(yǔ)進(jìn)行編碼,得到短語(yǔ)向量,具體包括:對(duì)所述目標(biāo)短語(yǔ)中的各個(gè)詞語(yǔ)對(duì)應(yīng)的詞向量進(jìn)行平均或加權(quán)平均,得到短語(yǔ)向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110213834.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種自然語(yǔ)言的搜索方法及系統(tǒng)
- 基于交互上下文處理自然語(yǔ)言方法
- 計(jì)算機(jī)化的自然語(yǔ)言查詢意圖分派
- 自然語(yǔ)言描述信息的生成方法及裝置
- 風(fēng)格可定制的文本生成
- 多輪預(yù)制對(duì)話
- 改變應(yīng)答以提供表現(xiàn)豐富的自然語(yǔ)言對(duì)話的方法、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言查詢的轉(zhuǎn)換
- 一種自然語(yǔ)言處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言理解模型訓(xùn)練方法、自然語(yǔ)言理解方法及裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





