[發(fā)明專(zhuān)利]一種基于卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的文本情感分類(lèi)算法有效
| 申請(qǐng)?zhí)枺?/td> | 201810459139.0 | 申請(qǐng)日: | 2018-05-15 |
| 公開(kāi)(公告)號(hào): | CN108664632B | 公開(kāi)(公告)日: | 2021-09-21 |
| 發(fā)明(設(shè)計(jì))人: | 董敏;湯雪;畢盛 | 申請(qǐng)(專(zhuān)利權(quán))人: | 華南理工大學(xué) |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06F40/284;G06N3/04 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 510640 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 卷積 神經(jīng)網(wǎng)絡(luò) 注意力 機(jī)制 文本 情感 分類(lèi) 算法 | ||
1.一種基于卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的文本情感分類(lèi)算法,其特征在于,包括以下步驟:
1)建立包含多種卷積和池化的卷積神經(jīng)網(wǎng)絡(luò),使用情感分類(lèi)文本進(jìn)行訓(xùn)練,得到第一個(gè)模型;
2)建立加入殘差連接和非線(xiàn)性的多頭點(diǎn)積注意力機(jī)制,使用情感分類(lèi)文本進(jìn)行訓(xùn)練,得到第二個(gè)模型;
3)對(duì)兩個(gè)模型進(jìn)行模型融合,得到文本最終的情感分類(lèi),其具體如下:
使用Bagging的模型融合方法,對(duì)兩個(gè)模型進(jìn)行模型融合,得到文本的最終類(lèi)別;假定數(shù)據(jù)集的類(lèi)別數(shù)目為K,對(duì)于特定的樣本x,第一個(gè)模型預(yù)測(cè)樣本x屬于各個(gè)類(lèi)別的概率為p1=[p1,p2,...,pK],其融合權(quán)重為λ1;第二個(gè)模型預(yù)測(cè)樣本x屬于各個(gè)類(lèi)別的概率為p2=[p1,p2,...,pK],其融合權(quán)重為λ2;對(duì)于特定的樣本x,其最終的預(yù)測(cè)屬于各個(gè)類(lèi)別的概率為p=λ1p1+λ2p2;對(duì)于特定的樣本x,其最終預(yù)測(cè)類(lèi)別為預(yù)測(cè)其屬于各個(gè)類(lèi)別的概率向量p中最大值對(duì)應(yīng)的索引值
2.根據(jù)權(quán)利要求1所述的一種基于卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的文本情感分類(lèi)算法,其特征在于:在步驟1)中,建立包含多種卷積和池化的卷積神經(jīng)網(wǎng)絡(luò),包含以下步驟:
1.1)建立兩種不同類(lèi)型的卷積,第一種卷積的卷積核為整體卷積核,匹配整個(gè)詞向量,第二種卷積的卷積核為單維卷積核,就是在詞向量的每一維上進(jìn)行匹配;假設(shè)句子輸入sent∈Rlen×Dim是len個(gè)詞語(yǔ)序列,每一個(gè)詞語(yǔ)由Dim維詞向量表示,senti∈RDim代表詞語(yǔ)序列中第i個(gè)詞向量,senti:j代表第i到j(luò)個(gè)包括第j個(gè)詞向量的連接,代表第i個(gè)詞向量的第k維,代表第i到j(luò)個(gè)包括第j個(gè)詞向量的第k維;假設(shè)一個(gè)整體卷積核為w∈Rws×Dim,其滑窗寬度為ws,b∈R為偏置,h為激活函數(shù);當(dāng)卷積核w應(yīng)用于輸入詞語(yǔ)序列sent,w和sent內(nèi)每一個(gè)長(zhǎng)度為ws的詞向量窗口進(jìn)行內(nèi)積,加上偏置值b,應(yīng)用激活函數(shù)h,得到第一種卷積的輸出向量c1∈R1+len-ws,其中第i項(xiàng)等于c1[i]=h(w⊙senti:i+ws-1+b),i∈[1,1+len-ws],⊙表示內(nèi)積;假設(shè)一個(gè)應(yīng)用于詞向量的第k維的單維卷積核為單維卷積wk,wk∈Rws×1,ws為滑窗寬度,bk為偏置,h為激活函數(shù);卷積核wk的輸出向量ck∈R1+len-ws,其中第i項(xiàng)等于合并詞向量所有維度的輸出向量,得到第二種卷積的最終輸出c2=[c1,c2,...,cDim];
1.2)對(duì)卷積層兩種卷積的輸出c1和c2分別進(jìn)行最大池化和平均池化;假設(shè)第一種卷積的輸出向量c1∈R1+len-ws最大池化后的輸出為平均池化后的輸出為假設(shè)對(duì)第二種卷積的輸出矩陣c2∈R(1+len-ws)×Dim的第j個(gè)詞向量維度上的向量c2[j]∈R1+len-ws進(jìn)行最大池化后的結(jié)果為平均池化后的結(jié)果為對(duì)這兩個(gè)值進(jìn)行按位相減,再進(jìn)行絕對(duì)值操作,abs表示絕對(duì)值操作,得到輸出為pj;合并所有維度的結(jié)果,得到輸出向量為p∈RDim;假設(shè)對(duì)p進(jìn)行最大池化,得到第二種卷積的最大池化后的最終輸出為平均池化后的最終輸出為連接兩種卷積的四個(gè)池化輸出值和得到池化層的最終輸出向量表示連接操作;
1.3)在卷積層使用不同滑窗寬度ws的卷積核。
3.根據(jù)權(quán)利要求1所述的一種基于卷積神經(jīng)網(wǎng)絡(luò)和注意力機(jī)制的文本情感分類(lèi)算法,其特征在于:在步驟2)中,所述多頭點(diǎn)積注意力機(jī)制由多頭注意力機(jī)制和點(diǎn)積注意力機(jī)制組成,所述多頭注意力機(jī)制是指并性地做多次注意力,所述點(diǎn)積注意力機(jī)制是指使用點(diǎn)積計(jì)算輸入每個(gè)時(shí)刻的注意力權(quán)重的注意力機(jī)制,建立加入殘差連接和非線(xiàn)性的多頭點(diǎn)積注意力機(jī)制,包括以下步驟:
2.1)建立加入殘差連接和非線(xiàn)性的點(diǎn)積注意力機(jī)制;假設(shè)句子輸入s∈Rlen×Dim是len個(gè)詞語(yǔ)序列,每一個(gè)詞語(yǔ)由Dim維詞向量表示,si∈RDim代表詞語(yǔ)序列中第i個(gè)詞向量;假設(shè)第i個(gè)詞向量的輸入向量si的權(quán)重為w,對(duì)其進(jìn)行內(nèi)積,wi=w⊙si,⊙表示內(nèi)積;獲得每個(gè)詞向量的注意力權(quán)重wi后,對(duì)其進(jìn)行歸一化,αi=softmax(wi),αi表示歸一化后的第i個(gè)詞向量的注意力權(quán)重;得到歸一化的注意力概率后,加入殘差連接,第i個(gè)詞向量的輸出向量vi=αisi+si,即將權(quán)重αi與輸入si相乘后,再加上輸入si本身;再進(jìn)行非線(xiàn)性變換,得到第i個(gè)詞向量的輸出向量vi=relu(vi),relu(x)表示非線(xiàn)性relu函數(shù);最后,對(duì)所有詞向量的輸出向量進(jìn)行求和,得到最終的點(diǎn)積注意力機(jī)制輸出向量其中v∈RDim;
2.2)并性地做多次注意力;根據(jù)步驟2.1),多次建立加入殘差連接和非線(xiàn)性的點(diǎn)積注意力機(jī)制,假設(shè)第j個(gè)注意力機(jī)制的權(quán)重為wj,其輸出向量為vj,對(duì)所有注意力機(jī)制的輸出向量進(jìn)行連接,得到多頭點(diǎn)積注意力機(jī)制的最終輸出向量表示連接操作,其中h表示多頭注意力機(jī)制中的注意力個(gè)數(shù),即并行地做多次注意力的次數(shù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810459139.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶(hù)注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置





