[發(fā)明專利]對(duì)話語(yǔ)句的語(yǔ)義解析方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201811523979.5 | 申請(qǐng)日: | 2018-12-13 |
| 公開(公告)號(hào): | CN109637527B | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計(jì))人: | 俞凱;朱蘇;趙子健 | 申請(qǐng)(專利權(quán))人: | 思必馳科技股份有限公司 |
| 主分類號(hào): | G10L15/18 | 分類號(hào): | G10L15/18;G10L15/197;G10L15/16;G10L15/06;G06N3/04 |
| 代理公司: | 北京商專永信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400 | 代理人: | 方挺;黃謙 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 對(duì)話 語(yǔ)句 語(yǔ)義 解析 方法 系統(tǒng) | ||
本發(fā)明實(shí)施例提供一種對(duì)話語(yǔ)句的語(yǔ)義解析方法。該方法包括:通過(guò)長(zhǎng)短時(shí)記憶網(wǎng)絡(luò),確定對(duì)話語(yǔ)句的連續(xù)實(shí)值表示向量以及詞序列向量;優(yōu)先將連續(xù)實(shí)值表示向量輸入至用于行為分類的第一多層感知網(wǎng)絡(luò),確定act type;再將連續(xù)實(shí)值表示向量以及act type輸入至用于實(shí)體分類的第二多層感知網(wǎng)絡(luò),確定與各act type相對(duì)應(yīng)的slot;將配對(duì)后的act?slot、連續(xù)實(shí)值表示向量以及詞序列向量作為輸入?yún)?shù),通過(guò)基于編碼?解碼模型的指針網(wǎng)絡(luò),確定與act?slot相對(duì)應(yīng)的value實(shí)體值;將value實(shí)體值與act?slot進(jìn)行配對(duì),生成act?slot?value三元組確定為對(duì)話語(yǔ)句的語(yǔ)義。本發(fā)明實(shí)施例還提供一種對(duì)話語(yǔ)句的語(yǔ)義解析系統(tǒng)。本發(fā)明實(shí)施例通過(guò)優(yōu)先預(yù)測(cè)act?slot,建立act type與slot type間的關(guān)系,從而確定正確的act?slot?value三元組。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能領(lǐng)域,尤其涉及一種對(duì)話語(yǔ)句的語(yǔ)義解析方法及系統(tǒng)。
背景技術(shù)
SLU(Spoken language understanding,口語(yǔ)理解)是SDS(spoken dialoguesystem,對(duì)話語(yǔ)音系統(tǒng))的關(guān)鍵組成部分,將用戶的話語(yǔ)解析為相應(yīng)的語(yǔ)義形式。通常SLU的解析問(wèn)題被視為序列標(biāo)記任務(wù),需要單詞級(jí)別的注釋,除了單詞對(duì)齊注釋之外,還有一種句子級(jí)的語(yǔ)義注釋是不對(duì)齊的,例如對(duì)話語(yǔ)句:“我想找一個(gè)價(jià)格昂貴的餐廳”,其對(duì)話語(yǔ)句就有一個(gè)行為-槽-值的三重注釋“通知(價(jià)格范圍=昂貴)”和話語(yǔ)“它所服務(wù)的食物類型”具有“請(qǐng)求(食物)”的注釋。
未對(duì)齊的SLU與對(duì)齊的SLU相比具有一些優(yōu)勢(shì)。首先,作為ASR(Automatic SpeechRecognition,自動(dòng)語(yǔ)音識(shí)別)的下游模塊,基于統(tǒng)計(jì)方法的SLU模塊通常要求在ASR的輸出上標(biāo)記訓(xùn)練數(shù)據(jù),這可以提高對(duì)ASR錯(cuò)誤的魯棒性。因此,由于ASR錯(cuò)誤(尤其是單詞插入和錯(cuò)誤刪除),很難并且有時(shí)不可能將語(yǔ)義注釋與ASR輸出對(duì)齊。
其次,價(jià)值別名也難以以字對(duì)齊的方式處理,這會(huì)非常耗時(shí),所以一般對(duì)具有未對(duì)齊語(yǔ)義注釋的SLU上,將句子標(biāo)記為一組act-slot-value三元組。針對(duì)于非對(duì)其數(shù)據(jù)的口語(yǔ)理解,把a(bǔ)ct-slot-value三元組當(dāng)成一個(gè)標(biāo)簽,之后把整個(gè)任務(wù)建模成多標(biāo)簽分類任務(wù),分模塊來(lái)預(yù)測(cè)act-slot-value三元組的各部分,通過(guò)關(guān)系最密切的slot type和slot value的對(duì)應(yīng)關(guān)系,合成相應(yīng)的slot-value pairs(實(shí)體-值對(duì))。然后再合成相應(yīng)的act-slot-value三元組。
在實(shí)現(xiàn)本發(fā)明過(guò)程中,發(fā)明人發(fā)現(xiàn)相關(guān)技術(shù)中至少存在如下問(wèn)題:
現(xiàn)有方法分別忽略了act行為/行為類型和slot實(shí)體的act-slot pairrepresentation(行為實(shí)體槽對(duì)表示)。使得在組合三元組的這一步,當(dāng)一個(gè)對(duì)話語(yǔ)音對(duì)應(yīng)著多個(gè)act-slot-value三元組時(shí),盡管該系統(tǒng)知道slot type和slot value的對(duì)應(yīng)關(guān)系,可以合成出相應(yīng)的slot-value paris,但是它并不知道act type和slot-value pairs的對(duì)應(yīng)關(guān)系,無(wú)法合成正確的act-slot-value三元組。
發(fā)明內(nèi)容
為了至少解決現(xiàn)有技術(shù)中當(dāng)一個(gè)對(duì)話語(yǔ)音對(duì)應(yīng)著多個(gè)act-slot-value三元組時(shí),無(wú)法確定act type活動(dòng)類型和slot-value pairs實(shí)體數(shù)值的對(duì)應(yīng)關(guān)系,無(wú)法合成正確的act-slot-value三元組的問(wèn)題。
第一方面,本發(fā)明實(shí)施例提供一種對(duì)話語(yǔ)句的語(yǔ)義解析方法,包括:
通過(guò)長(zhǎng)短時(shí)記憶網(wǎng)絡(luò),確定對(duì)話語(yǔ)句的連續(xù)實(shí)值表示向量以及詞序列向量;
優(yōu)先將所述連續(xù)實(shí)值表示向量輸入至用于行為分類的第一多層感知網(wǎng)絡(luò),確定至少一個(gè)行為類型act type;
再將所述連續(xù)實(shí)值表示向量以及所述至少一個(gè)行為類型act type輸入至用于實(shí)體分類的第二多層感知網(wǎng)絡(luò),確定與各行為類型act type相對(duì)應(yīng)的實(shí)體slot;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811523979.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 對(duì)話控制裝置、對(duì)話控制方法以及記錄介質(zhì)
- 任務(wù)對(duì)話系統(tǒng)中的對(duì)話處理方法及裝置
- 一種人機(jī)對(duì)話的方法、裝置和存儲(chǔ)介質(zhì)
- 對(duì)話(中)獎(jiǎng)勵(lì)評(píng)估和對(duì)話方法、介質(zhì)、裝置和計(jì)算設(shè)備
- 一種對(duì)話方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種輔助英文對(duì)話的方法及系統(tǒng)
- 一種回復(fù)對(duì)話評(píng)分模型訓(xùn)練方法、對(duì)話回復(fù)方法及其裝置
- 一種多輪對(duì)話的問(wèn)題定位方法及裝置
- 文本對(duì)話方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 對(duì)話型文本分類方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 基于聊天大數(shù)據(jù)知識(shí)庫(kù)的機(jī)器人對(duì)話控制方法和系統(tǒng)
- 基于大數(shù)據(jù)搜索的幽默型機(jī)器人對(duì)話控制方法和系統(tǒng)
- 基于對(duì)話知識(shí)庫(kù)的機(jī)器人對(duì)話控制方法和系統(tǒng)
- 一種自然語(yǔ)言語(yǔ)句評(píng)價(jià)方法及裝置
- 句子級(jí)雙語(yǔ)對(duì)齊方法及系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種翻譯模型結(jié)果重排序的方法及裝置
- 用于輸出信息的方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 搜索推薦方法和裝置、服務(wù)器、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本識(shí)別方法、裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 面向語(yǔ)義Web服務(wù)程序設(shè)計(jì)的語(yǔ)義數(shù)據(jù)表示和處理方法
- 一種基于語(yǔ)義的三維模型檢索系統(tǒng)和方法
- 一種計(jì)算機(jī)語(yǔ)義工程系統(tǒng)
- 導(dǎo)航方法及裝置
- 一種分層次多語(yǔ)義網(wǎng)系統(tǒng)及方法
- 一種基于上下文的語(yǔ)義匹配方法和系統(tǒng)
- 遠(yuǎn)程語(yǔ)義識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于語(yǔ)義依存關(guān)系的醫(yī)療文本標(biāo)注方法
- 基于多級(jí)語(yǔ)義表征和語(yǔ)義計(jì)算的信號(hào)語(yǔ)義識(shí)別方法
- 語(yǔ)義分類方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備





