[發(fā)明專利]用于對話系統(tǒng)的指代消解方法、裝置及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210431596.5 | 申請日: | 2022-04-22 |
| 公開(公告)號: | CN114818657A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 馬伯睿;朱亞杰;王章定;魏德山;王波 | 申請(專利權(quán))人: | 合眾新能源汽車有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/30;G06K9/62 |
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 駱希聰 |
| 地址: | 314500 浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 對話 系統(tǒng) 指代 消解 方法 裝置 存儲 介質(zhì) | ||
1.一種用于對話系統(tǒng)的指代消解方法,其特征在于,包括:
將對話系統(tǒng)接收到的句子進(jìn)行編碼,得到所述句子的句矩陣;
將所述句矩陣輸入第一分類器組,獲得所述句子的先行語的頭索引和尾索引;
根據(jù)所述先行語的頭索引和尾索引獲得先行語向量;
將所述先行語向量與所述句矩陣作點(diǎn)積得到相關(guān)向量;
將所述相關(guān)向量輸入第二分類器組,獲得所述句子的一個或多個照應(yīng)語的頭索引和尾索引;
根據(jù)所述先行語的頭索引和尾索引從所述句子中取出先行語,根據(jù)所述一個或多個照應(yīng)語的頭索引和尾索引從所述句子中取出一個或多個照應(yīng)語,得到指代消解結(jié)果。
2.如權(quán)利要求1所述的指代消解方法,其特征在于,所述第一分類器組和所述第二分類器組中的分類器為二元分類器。
3.如權(quán)利要求2所述的指代消解方法,其特征在于,所述第一分類器組內(nèi)的分類器表示為:
其中是句矩陣中第i個位置是先行語的索引的概率,hi是句矩陣中的第i個位置的向量,Want是第一權(quán)重矩陣,bant是第一偏置,σ是激活函數(shù),softmax是歸一化指數(shù)函數(shù),softmax函數(shù)將的最大值設(shè)為1,其余值為0,是指示第i個位置是否為先行語的索引的結(jié)果。
4.如權(quán)利要求3所述的指代消解方法,其特征在于,所述第一分類器組包括
第一分類器,用于識別所述句子中的先行語的頭索引;
第二分類器,用于識別所述句子中的先行語的尾索引。
5.如權(quán)利要求1所述的指代消解方法,其特征在于,根據(jù)所述先行語的頭索引和尾索引獲得先行語向量的步驟包括:
取出所述句矩陣中所述先行語的頭索引和尾索引之間的所有向量;
將取出的所述所有向量求和得到先行語向量。
6.如權(quán)利要求2所述的指代消解方法,其特征在于,所述第二分類器組內(nèi)的分類器表示為:
采用如下公式計(jì)算句矩陣中其第i個位置是照應(yīng)語的索引的概率,
其中是句矩陣中其第i個位置是照應(yīng)語的索引的概率,h′i是相關(guān)向量的第i個位置的向量,Wana是第二權(quán)重矩陣,bana是第二偏置,σ是激活函數(shù);
設(shè)定第一閾值,將所述照應(yīng)語的索引的概率大于第一閾值的分類結(jié)果設(shè)為1,否則,設(shè)為0。
7.如權(quán)利要求6所述的指代消解方法,其特征在于,所述第二分類器組包括:
第三分類器,用于識別所述句子中的照應(yīng)語的頭索引;
第四分類器,用于識別所述句子中的照應(yīng)語的尾索引。
8.如權(quán)利要求1所述的指代消解方法,其特征在于,在根據(jù)所述一個或多個照應(yīng)語的頭索引和尾索引從所述句子中取出一個或多個照應(yīng)語之前,還包括步驟:
將所述一個或多個照應(yīng)語的頭索引和尾索引進(jìn)行一一配對,未出現(xiàn)頭索引的尾索引或未出現(xiàn)尾索引的頭索引不進(jìn)行配對,最終得到一個或多個照應(yīng)語的索引對。
9.如權(quán)利要求1所述的指代消解方法,其特征在于,通過預(yù)訓(xùn)練編碼器對所述句子進(jìn)行編碼。
10.如權(quán)利要求9所述的指代消解方法,其特征在于,所述預(yù)訓(xùn)練編碼器為具有構(gòu)建上下文依賴能力的編碼器。
11.如權(quán)利要求9所述的指代消解方法,其特征在于,所述句矩陣的大小為M*N,其中M為編碼后每個字向量或詞向量的維度,N為句子長度。
12.如權(quán)利要求1所述的指代消解方法,其特征在于,還包括:
對接收到的句子進(jìn)行預(yù)處理,所述預(yù)處理包括分詞、詞性和去除停用詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合眾新能源汽車有限公司,未經(jīng)合眾新能源汽車有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210431596.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種卷煙技術(shù)標(biāo)準(zhǔn)數(shù)據(jù)處理方法及裝置
- 指代消解方法、電子裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 基于成分句法壓縮樹的指代消解方法
- 一種基于強(qiáng)化學(xué)習(xí)的指代消解方法
- 基于知識圖譜的實(shí)體鏈接方法、裝置、設(shè)備和存儲介質(zhì)
- 一種利用語言模型的指代消解弱監(jiān)督學(xué)習(xí)方法
- 文本處理方法及設(shè)備、信息抽取方法及系統(tǒng)、介質(zhì)
- 一種卡托普利作用機(jī)制的模型教具
- 多輪對話系統(tǒng)的指代消解方法
- 一種基于神經(jīng)網(wǎng)絡(luò)的長文本指代消解方法和裝置





