[發(fā)明專利]統(tǒng)一的對話理解方法及框架在審

申請?zhí)枺?/td>	202210342533.2	申請日：	2022-03-31
公開（公告）號：	CN114896988A	公開（公告）日：	2022-08-12
發(fā)明（設(shè)計）人：	俞凱;陳露;陳志	申請（專利權(quán)）人：	思必馳科技股份有限公司
主分類號：	G06F40/35	分類號：	G06F40/35
代理公司：	北京商專永信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400	代理人：	黃謙;侯曉艷
地址：	215123 江蘇省蘇州市蘇***	國省代碼：	江蘇;32
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	統(tǒng)一對話理解方法框架
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明實施例提供一種統(tǒng)一的對話理解方法。該方法包括：將各類別的對話理解任務(wù)按照統(tǒng)一的生成范式轉(zhuǎn)換為多個生成式對話任務(wù)；將多個生成式對話任務(wù)輸入至任務(wù)統(tǒng)一生成式模型，輸出與多個生成式對話任務(wù)對應(yīng)的任務(wù)標(biāo)識和任務(wù)答案，以解決各類別的對話理解任務(wù)。本發(fā)明實施例還提供一種統(tǒng)一的對話理解框架。本發(fā)明實施例提出了一個統(tǒng)一的生成性對話理解框架，用于在多個對話理解任務(wù)中共享知識。為了緩解偏差生成問題，改進(jìn)了現(xiàn)有的可學(xué)習(xí)權(quán)重方法，該方法可以獲得最佳的整體性能。與現(xiàn)有模型相比，本方法的UniDU在多個DU任務(wù)上實現(xiàn)了更好的性能。進(jìn)一步深入研究了影響因素。最后，實驗結(jié)果表明，UniDU模型在小樣本和零樣本設(shè)置下也能獲得優(yōu)異的性能。

技術(shù)領(lǐng)域

本發(fā)明涉及智能語音領(lǐng)域，尤其涉及一種統(tǒng)一的對話理解方法及框架。

背景技術(shù)

會話系統(tǒng)的發(fā)展對智能設(shè)備的普及起著重要作用，如智能助手。近年來，人們對神經(jīng)對話系統(tǒng)越來越感興趣。對話理解是神經(jīng)對話系統(tǒng)中的核心技術(shù)，旨在從不同的細(xì)粒度角度準(zhǔn)確分析對話。然而對話理解任務(wù)有多種類型，例如給出一段題干和問題確定對應(yīng)的答案，或者給出一段長文本確定簡短的關(guān)鍵語句等。由于各任務(wù)格式不同，這些DU(Dialogue Understanding，對話理解)任務(wù)仍然是獨立學(xué)習(xí)的。

在對話任務(wù)學(xué)習(xí)中有：

多任務(wù)學(xué)習(xí)在對話理解中的應(yīng)用：利用不同理解任務(wù)的語料訓(xùn)練共享的對話編碼模型，不同的任務(wù)還是有自己獨立的解碼模塊，對于分類問題用特殊符號代表的對話表示做分類計算，對于序列標(biāo)注問題在每一個詞上做標(biāo)注計算，對于生成問題會有獨立的自回歸式解碼計算。

生成式的方法在對話建模中的應(yīng)用：生成式的對話建模一般是指將對話內(nèi)容用語言模型的方式進(jìn)行建模，將對話建模變成對話生成問題，然后利用其他標(biāo)注信息來幫助對話生成的質(zhì)量。

在實現(xiàn)本發(fā)明過程中，發(fā)明人發(fā)現(xiàn)相關(guān)技術(shù)中至少存在如下問題：

關(guān)于多任務(wù)學(xué)習(xí)在對話理解中的應(yīng)用：不同的對話理解問題仍然需要被設(shè)定為不同的對話理解任務(wù)，比如說對話意圖識別是分類任務(wù)，對話槽填充是序列標(biāo)注任務(wù)和對話簡寫是生成任務(wù)。不同的任務(wù)都是有自己獨立的一套參數(shù)，這種方式不利于探索不同任務(wù)之間的影響，因為還是要受限于模型的影響。另外，這種多任務(wù)訓(xùn)練方式的可擴(kuò)展性較差，不同任務(wù)還是需要獨立建模，對于內(nèi)存的要求較高，幾乎是隨著任務(wù)數(shù)量的增加成線性增長。

生成式的方法在對話建模中的應(yīng)用：僅僅是以對話生成問題作為主要問題，沒有考慮在訓(xùn)練過程中不同多任務(wù)訓(xùn)練方式對不同對話理解任務(wù)的影響。也沒有深入討論大量其他形式的對話理解任務(wù)的影響。

發(fā)明內(nèi)容

為了至少解決現(xiàn)有技術(shù)中不同任務(wù)還是需要獨立建模，不利于對話理解不同對話任務(wù)，全局考慮所有對話理解任務(wù)的性能要求，只是為了將其他任務(wù)來提升對話生成任務(wù)的性能，沒有考慮不同多任務(wù)訓(xùn)練方式的影響的問題。第一方面，本發(fā)明實施例提供一種統(tǒng)一的對話理解方法，包括：

將各類別的對話理解任務(wù)按照統(tǒng)一的生成范式轉(zhuǎn)換為多個生成式對話任務(wù)；

將所述多個生成式對話任務(wù)輸入至任務(wù)統(tǒng)一生成式模型，輸出與所述多個生成式對話任務(wù)對應(yīng)的任務(wù)標(biāo)識和任務(wù)答案，以解決各類別的對話理解任務(wù)。

第二方面，本發(fā)明實施例提供一種統(tǒng)一的對話理解框架，包括：

統(tǒng)一轉(zhuǎn)換程序模塊，用于將各類別的對話理解任務(wù)按照統(tǒng)一的生成范式轉(zhuǎn)換為多個生成式對話任務(wù)；

對話理解程序模塊，用于將所述多個生成式對話任務(wù)輸入至任務(wù)統(tǒng)一生成式模型，輸出與所述多個生成式對話任務(wù)對應(yīng)的任務(wù)標(biāo)識和任務(wù)答案，以解決各類別的對話理解任務(wù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思必馳科技股份有限公司，未經(jīng)思必馳科技股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210342533.2/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：自動駕駛車輛實時監(jiān)控視頻傳輸系統(tǒng)
下一篇：語音交互方法、裝置及存儲介質(zhì)

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】