[發(fā)明專利]用于對(duì)話系統(tǒng)的指代消解方法、裝置及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202210431596.5 | 申請(qǐng)日: | 2022-04-22 |
| 公開(公告)號(hào): | CN114818657A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 馬伯睿;朱亞杰;王章定;魏德山;王波 | 申請(qǐng)(專利權(quán))人: | 合眾新能源汽車有限公司 |
| 主分類號(hào): | G06F40/211 | 分類號(hào): | G06F40/211;G06F40/30;G06K9/62 |
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 駱希聰 |
| 地址: | 314500 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 對(duì)話 系統(tǒng) 指代 消解 方法 裝置 存儲(chǔ) 介質(zhì) | ||
本發(fā)明涉及一種用于對(duì)話系統(tǒng)的指代消解方法,方法包括:將對(duì)話系統(tǒng)接收到的句子進(jìn)行編碼,得到句子的句矩陣;將句矩陣輸入第一分類器組,獲得句子的先行語的頭索引和尾索引;根據(jù)先行語的頭索引和尾索引獲得先行語向量;將先行語向量與句矩陣作點(diǎn)積得到相關(guān)向量;將相關(guān)向量輸入第二分類器組,獲得句子的一個(gè)或多個(gè)照應(yīng)語的頭索引和尾索引;根據(jù)先行語的頭索引和尾索引從句子中取出先行語,根據(jù)一個(gè)或多個(gè)照應(yīng)語的頭索引和尾索引從句子中取出一個(gè)或多個(gè)照應(yīng)語,得到指代消解結(jié)果。本發(fā)明可以識(shí)別句子中同一個(gè)先行語所對(duì)應(yīng)的多個(gè)照應(yīng)語,為后續(xù)的對(duì)話內(nèi)容處理提供更加完整的信息。
技術(shù)領(lǐng)域
本發(fā)明主要涉及自然語言處理領(lǐng)域,具體地涉及一種用于對(duì)話系統(tǒng)的指代消解方法、裝置及存儲(chǔ)介質(zhì)。
背景技術(shù)
指代消解旨在識(shí)別句子中同一實(shí)體的多種不同表述方式。在智能座艙的對(duì)話系統(tǒng)中,用戶時(shí)常會(huì)習(xí)慣性的使用代詞來指代在前文中提到過的人、物、概念等實(shí)體以避免重復(fù)的字、詞出現(xiàn)在對(duì)話中。例如用戶在智能座艙中向語音助手詢問:“昨天晚上有國足的比賽,他們進(jìn)了幾個(gè)球?他們進(jìn)了幾個(gè)烏龍球”,該句子中“他們”即是“國足”的代替表達(dá)方式。通常我們稱句子中的“國足”為先行語(Antecedent),“他們”為照應(yīng)語(Anaphor)。這種人類的直覺性的表達(dá)方式在由計(jì)算機(jī)解析時(shí)常會(huì)由于結(jié)構(gòu)不夠清晰而產(chǎn)生指代消解問題,造成句子的錯(cuò)誤理解,從而導(dǎo)致糟糕的用戶體驗(yàn)甚至在駕駛過程中產(chǎn)生危險(xiǎn)。
在一些方案中,將指代消解問題轉(zhuǎn)化為照應(yīng)語-先行語聯(lián)合最優(yōu)解的問題,將照應(yīng)語-先行語輸入聯(lián)合模型中,求模型的最優(yōu)解以獲得照應(yīng)語對(duì)應(yīng)的先行語。但是該方案照應(yīng)語與先行語是一一對(duì)應(yīng)的,無法識(shí)別句子中同一個(gè)先行語所對(duì)應(yīng)的多個(gè)照應(yīng)語。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種用于對(duì)話系統(tǒng)的指代消解方法、裝置及存儲(chǔ)介質(zhì),可以識(shí)別句子中同一個(gè)先行語所對(duì)應(yīng)的多個(gè)照應(yīng)語。
本發(fā)明提供一種用于對(duì)話系統(tǒng)的指代消解方法,包括:將對(duì)話系統(tǒng)接收到的句子進(jìn)行編碼,得到所述句子的句矩陣;將所述句矩陣輸入第一分類器組,獲得所述句子的先行語的頭索引和尾索引;根據(jù)所述先行語的頭索引和尾索引獲得先行語向量;將所述先行語向量與所述句矩陣作點(diǎn)積得到相關(guān)向量;將所述相關(guān)向量輸入第二分類器組,獲得所述句子的一個(gè)或多個(gè)照應(yīng)語的頭索引和尾索引;根據(jù)所述先行語的頭索引和尾索引從所述句子中取出先行語,根據(jù)所述一個(gè)或多個(gè)照應(yīng)語的頭索引和尾索引從所述句子中取出一個(gè)或多個(gè)照應(yīng)語,得到指代消解結(jié)果。
在本發(fā)明的一實(shí)施例中,所述第一分類器組和所述第二分類器組中的分類器為二元分類器。
在本發(fā)明的一實(shí)施例中,所述第一分類器組內(nèi)的分類器可表示為:
其中是句矩陣中第i個(gè)位置是先行語的索引的概率,hi是句矩陣中的第i個(gè)位置的向量,Want是第一權(quán)重矩陣,bant是第一偏置,σ是激活函數(shù),softmax是歸一化指數(shù)函數(shù),softmax函數(shù)將的最大值設(shè)為1,其余值為0,是指示第i個(gè)位置是否為先行語的索引的結(jié)果。
在本發(fā)明的一實(shí)施例中,所述第一分類器組包括第一分類器,用于識(shí)別所述句子中的先行語的頭索引;第二分類器,用于識(shí)別所述句子中的先行語的尾索引。
在本發(fā)明的一實(shí)施例中,根據(jù)所述先行語的頭索引和尾索引獲得先行語向量的步驟包括:取出所述句矩陣中所述先行語的頭索引和尾索引之間的所有向量;將取出的所述所有向量求和得到先行語向量。
在本發(fā)明的一實(shí)施例中,所述第二分類器組內(nèi)的分類器可表示為:采用如下公式計(jì)算句矩陣中第i個(gè)位置是照應(yīng)語的索引的概率,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合眾新能源汽車有限公司,未經(jīng)合眾新能源汽車有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210431596.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 對(duì)話控制裝置、對(duì)話控制方法以及記錄介質(zhì)
- 任務(wù)對(duì)話系統(tǒng)中的對(duì)話處理方法及裝置
- 一種人機(jī)對(duì)話的方法、裝置和存儲(chǔ)介質(zhì)
- 對(duì)話(中)獎(jiǎng)勵(lì)評(píng)估和對(duì)話方法、介質(zhì)、裝置和計(jì)算設(shè)備
- 一種對(duì)話方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種輔助英文對(duì)話的方法及系統(tǒng)
- 一種回復(fù)對(duì)話評(píng)分模型訓(xùn)練方法、對(duì)話回復(fù)方法及其裝置
- 一種多輪對(duì)話的問題定位方法及裝置
- 文本對(duì)話方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 對(duì)話型文本分類方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 一種卷煙技術(shù)標(biāo)準(zhǔn)數(shù)據(jù)處理方法及裝置
- 指代消解方法、電子裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于成分句法壓縮樹的指代消解方法
- 一種基于強(qiáng)化學(xué)習(xí)的指代消解方法
- 基于知識(shí)圖譜的實(shí)體鏈接方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種利用語言模型的指代消解弱監(jiān)督學(xué)習(xí)方法
- 文本處理方法及設(shè)備、信息抽取方法及系統(tǒng)、介質(zhì)
- 一種卡托普利作用機(jī)制的模型教具
- 多輪對(duì)話系統(tǒng)的指代消解方法
- 一種基于神經(jīng)網(wǎng)絡(luò)的長(zhǎng)文本指代消解方法和裝置





