[發(fā)明專利]一種基于自注意力機(jī)制的情感對(duì)話生成方法與裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201910596166.7 | 申請(qǐng)日: | 2019-07-03 |
| 公開(kāi)(公告)號(hào): | CN110427490B | 公開(kāi)(公告)日: | 2021-11-09 |
| 發(fā)明(設(shè)計(jì))人: | 魏巍;劉家邑;陳志毅;王子揚(yáng);王贊博;李恒 | 申請(qǐng)(專利權(quán))人: | 華中科技大學(xué) |
| 主分類(lèi)號(hào): | G06F16/36 | 分類(lèi)號(hào): | G06F16/36;G06F40/30;G06N3/04 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 李丹 |
| 地址: | 430074 湖北省武*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 注意力 機(jī)制 情感 對(duì)話 生成 方法 裝置 | ||
1.一種基于自注意力機(jī)制的情感對(duì)話生成方法,其特征在于,包括以下步驟:
1)接收用戶Post的輸入語(yǔ)句以及對(duì)應(yīng)的情感標(biāo)簽Ep,所述用戶輸入語(yǔ)句包括詞的特征向量表示序列X={x1,x2,......,xn};
2)根據(jù)步驟1)接收語(yǔ)句的情感信息和語(yǔ)義信息,獲得回復(fù)情感Er;
2.1)根據(jù)接收語(yǔ)句信息,將用戶輸入的序列轉(zhuǎn)換為情感向量表示;
具體步驟如下:
2.1.1)將用戶輸入的序列的文字符號(hào)表示向量化,通過(guò)查詢預(yù)訓(xùn)練的情感詞嵌入列表,得到每個(gè)文字符號(hào)的情感向量表示;
2.1.2)對(duì)情感詞嵌入層輸出的字符級(jí)別的情感向量表示按照序列順序進(jìn)行GRU編碼,得到情感隱含層向量;
2.1.3)判斷輸入語(yǔ)句當(dāng)中每個(gè)詞的情感重要性,根據(jù)情感重要性對(duì)情感隱含層向量賦予相應(yīng)的權(quán)重,同時(shí)輸出所有隱含層向量加權(quán)求和后的整個(gè)句子的加權(quán)情感向量表示;
2.1.4)將加權(quán)情感向量表示映射成和情感標(biāo)簽類(lèi)別同維度的情感分布向量,作為接收語(yǔ)句情感向量表示;
2.2)根據(jù)接收語(yǔ)句信息,將用戶輸入的序列轉(zhuǎn)換為語(yǔ)義向量表示;
具體步驟如下:
2.2.1)將用戶輸入的序列的文字符號(hào)表示向量化,得到每個(gè)文字符號(hào)的語(yǔ)義向量表示;
2.2.2)對(duì)語(yǔ)義向量表示按照序列順序進(jìn)行GRU編碼,得到情感隱含層向量;
2.2.3)判斷輸入語(yǔ)句當(dāng)中每個(gè)詞的語(yǔ)義重要性,根據(jù)語(yǔ)義重要性對(duì)語(yǔ)義隱含層向量賦予相應(yīng)的權(quán)重,同時(shí)輸出所有隱含層向量加權(quán)求和后的整個(gè)句子的加權(quán)語(yǔ)義向量表示;
2.3)將上述語(yǔ)義向量和情感向量拼接后,輸出情感-語(yǔ)義信息融合后的句子向量hes;
2.4)根據(jù)上述融合后的句子向量預(yù)測(cè)得到回復(fù)情感;
3)根據(jù)回復(fù)情感Er和接收語(yǔ)句的語(yǔ)義信息,生成對(duì)應(yīng)的回復(fù)。
2.根據(jù)權(quán)利要求1所述的基于自注意力機(jī)制的情感對(duì)話生成方法,其特征在于,所述步驟2.4)根據(jù)上述融合后的句子向量預(yù)測(cè)得到回復(fù)情感,具體如下:
在融合后的句子向量的基礎(chǔ)上通過(guò)一個(gè)激活函數(shù)為sigmoid函數(shù)的全連接層,將其映射成和情感標(biāo)簽類(lèi)別同維度的情感分布向量,即為所需要獲得的回復(fù)情感向量。
3.根據(jù)權(quán)利要求1所述的基于自注意力機(jī)制的情感對(duì)話生成方法,其特征在于,所述步驟3)中根據(jù)回復(fù)情感Er和接收語(yǔ)句的語(yǔ)義信息,生成對(duì)應(yīng)的回復(fù),具體如下:
對(duì)步驟2)產(chǎn)生的回復(fù)情感向量乘以一個(gè)情感嵌入矩陣,得到一個(gè)向量Ve之后,將此向量注入序列到序列模型中生成回復(fù)。
4.根據(jù)權(quán)利要求1所述的基于自注意力機(jī)制的情感對(duì)話生成方法,其特征在于,所述步驟2.1.3)判斷輸入語(yǔ)句當(dāng)中每個(gè)詞的情感重要性,根據(jù)情感重要性對(duì)情感隱含層向量賦予相應(yīng)的權(quán)重,同時(shí)輸出所有隱含層向量加權(quán)求和后的整個(gè)句子的加權(quán)情感向量表示,具體如下:
最終得到的隱含層向量是所有GRU單元的加權(quán)求和:
其中,ai是第i個(gè)隱含層的權(quán)重值,為GRU層中采用GRU單元,將序列X={x1,x2,......,xm}編碼得到的隱含向量
權(quán)值ai的計(jì)算方法是將輸入一個(gè)多層感知機(jī),然后通過(guò)一個(gè)softmax層使得所有的權(quán)值之和為1獲得,
5.一種基于自注意力機(jī)制的情感對(duì)話生成裝置,其特征在于,包括:
基于自注意力機(jī)制的情緒選擇器和回復(fù)生成器;
所述基于自注意力機(jī)制的情緒選擇器包括:用于情感信息編碼和語(yǔ)義信息編碼的編碼網(wǎng)絡(luò)、用于情感信息和語(yǔ)義信息融合的融合網(wǎng)絡(luò),以及根據(jù)融合網(wǎng)絡(luò)信息進(jìn)行情感選擇的預(yù)測(cè)網(wǎng)絡(luò);
所述編碼網(wǎng)絡(luò)包括:情感信息編碼器和語(yǔ)義信息編碼器;
所述情感信息編碼器包括情感詞嵌入層、GRU層和自注意力機(jī)制層和全連接層;
所述情感詞嵌入層用于將用戶輸入的序列的文字符號(hào)表示向量化,通過(guò)查詢預(yù)訓(xùn)練的情感詞嵌入列表,輸出每個(gè)文字符號(hào)的情感向量表示;
所述GRU層用于對(duì)情感詞嵌入層輸出的字符級(jí)別的情感向量表示按照序列順序進(jìn)行GRU編碼,輸出情感隱含層向量
所述自注意力機(jī)制 層用于判斷輸入語(yǔ)句當(dāng)中每個(gè)詞的情感重要性,對(duì)于包含關(guān)鍵情感信息的隱含層向量賦予對(duì)應(yīng)的權(quán)重,同時(shí)輸出所有隱含層向量加權(quán)求和后的整個(gè)句子的情感向量表示;
所述全連接層在自注意力層得到的情感向量表示的基礎(chǔ)上,通過(guò)一個(gè)激活函數(shù)為Sigmoid函數(shù)的全連接網(wǎng)絡(luò),將其映射成和情感標(biāo)簽類(lèi)別同維度的向量,用于預(yù)測(cè)Post的情感標(biāo)簽,同時(shí)采用交叉熵的約束損失函數(shù)來(lái)強(qiáng)迫情感信息編碼器學(xué)習(xí)情感信息;
所述語(yǔ)義信息編碼器包括語(yǔ)義詞嵌入層、GRU層和自注意力層;
所述語(yǔ)義詞嵌入層將用戶輸入的序列的文字符號(hào)表示向量化,與情感詞嵌入不同的是,語(yǔ)義詞嵌入層重點(diǎn)關(guān)注語(yǔ)義信息,輸出每個(gè)文字符號(hào)的語(yǔ)義向量表示;
GRU層對(duì)于字符級(jí)別的語(yǔ)義向量表示按照序列順序進(jìn)行GRU編碼,輸出語(yǔ)義隱含層向量
自注意力層用于判斷輸入語(yǔ)句當(dāng)中每個(gè)詞的語(yǔ)義重要性,對(duì)于包含關(guān)鍵語(yǔ)義信息的隱含層向量賦予其更高的權(quán)重,同時(shí)輸出所有隱含層向量加權(quán)求和后的整個(gè)句子的語(yǔ)義向量表示;
所述融合網(wǎng)絡(luò)用于計(jì)算接收語(yǔ)句中情感信息和語(yǔ)義信息的重要性分布,將上述語(yǔ)義向量和情感向量拼接后通過(guò)一個(gè)多層感知機(jī),自動(dòng)學(xué)習(xí)產(chǎn)生一個(gè)權(quán)值,并根據(jù)這個(gè)權(quán)值將he和hs融合起來(lái);最后輸出情感-語(yǔ)義信息融合后的句子向量hes;
所述預(yù)測(cè)網(wǎng)絡(luò),用于根據(jù)上述融合后的句子向量去預(yù)測(cè)最合適的回復(fù)情感;具體如下:
通過(guò)一個(gè)激活函數(shù)為sigmoid函數(shù)的全連接層,將融合后的句子向量映射成回復(fù)情感標(biāo)簽維度上的情感分布向量,同時(shí)采用交叉熵?fù)p失函數(shù)讓此向量逼近真實(shí)數(shù)據(jù)集當(dāng)中回復(fù)Response的情感標(biāo)簽;通過(guò)預(yù)測(cè)網(wǎng)絡(luò),產(chǎn)生的回復(fù)情感向量,將會(huì)被注入到回復(fù)生成器里用于指導(dǎo)帶情感的回復(fù)生成;
所述回復(fù)生成器包括情感偏差的注意力機(jī)制層和傳統(tǒng)的序列到序列模型;
所述的情感偏差的注意力機(jī)制層,是指對(duì)上述情緒選擇器產(chǎn)生的回復(fù)情感向量乘以一個(gè)情感嵌入矩陣,得到一個(gè)向量Ve之后,將此向量注入到傳統(tǒng)序列到序列模型當(dāng)中;
所述的傳統(tǒng)序列到序列模型,用于在注意力機(jī)制的基礎(chǔ)上,生成回復(fù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué),未經(jīng)華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910596166.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車(chē)市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





