[發(fā)明專(zhuān)利]一種基于Attention機(jī)制的多通道的文本分類(lèi)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201911191475.2 | 申請(qǐng)日: | 2019-11-28 |
| 公開(kāi)(公告)號(hào): | CN111061873B | 公開(kāi)(公告)日: | 2022-03-15 |
| 發(fā)明(設(shè)計(jì))人: | 劉磊;侯良文;孫應(yīng)紅;李靜 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06F40/242;G06F40/289 |
| 代理公司: | 北京思海天達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 吳蔭芳 |
| 地址: | 100124 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 attention 機(jī)制 通道 文本 分類(lèi) 方法 | ||
1.一種基于Attention機(jī)制的多通道的文本分類(lèi)方法,包括以下步驟:
步驟1文本預(yù)處理
1.1文本分詞,構(gòu)建預(yù)處理后語(yǔ)料庫(kù);
1.2構(gòu)建詞庫(kù),所述的詞庫(kù)由去除停用詞后且詞頻大于閾值θ的詞構(gòu)成,同時(shí)在詞庫(kù)中插入字符串“UNK”和“PAD”,其中“UNK”表示不能識(shí)別的詞,“PAD”表示為模型輸入中固定句子長(zhǎng)度需要填充的詞;
步驟2詞向量構(gòu)建
利用word2vec技術(shù),對(duì)預(yù)處理后的語(yǔ)料進(jìn)行詞向量的訓(xùn)練,詞向量的維度設(shè)置為d,得到預(yù)訓(xùn)練詞向量表,對(duì)詞庫(kù)中的每一個(gè)詞,若該詞在預(yù)訓(xùn)練詞向量表存在,則使用表中詞向量作為該詞的詞向量,若該詞在預(yù)訓(xùn)練詞向量表中不存在,則使用正態(tài)分布隨機(jī)初始化向量作為該詞的詞向量;
步驟3模型構(gòu)建
3.1詞向量的初始化
首先對(duì)于預(yù)處理后語(yǔ)料庫(kù)中每個(gè)句子,用詞向量替換句子中的每個(gè)詞,構(gòu)建句子的詞向量表示;
然后利用預(yù)訓(xùn)練詞向量創(chuàng)建的句子詞向量嵌入矩陣A∈Rl×d,構(gòu)建第1通道,表示如下:
A=[x1,x2,…,xi,…,xl]T 1≤i≤l
其中xi對(duì)應(yīng)句子中第i個(gè)詞的d維向量,l為句子的固定長(zhǎng)度;
利用均勻分布隨機(jī)初始化的詞向量創(chuàng)建的句子詞向量嵌入矩陣B∈Rl×d,構(gòu)建第2通道,表示如下:
B=[y1,y2,…,yi,…,yl]T 1≤i≤l
其中yi對(duì)應(yīng)句子中第i個(gè)詞的d維向量,l為句子的固定長(zhǎng)度;
將詞向量嵌入矩陣A和B在深度方向上進(jìn)行拼接,得到句子的雙通道詞向量嵌入矩陣C∈R2×l×d表示如下:
其中,表示兩個(gè)相同維度的二維矩陣在深度方向上的拼接符號(hào);
3.2引入Attention層
首先在第1和第2通道上引入Attention機(jī)制,將通道上的當(dāng)前詞向量重新編碼,通道1的詞向量xi, 1≤i≤l的上下文向量ui表示如下:
其中αij為詞向量xi對(duì)應(yīng)的權(quán)重值,l為句子固定長(zhǎng)度,αij>0且權(quán)重值αij按照如下公式計(jì)算:
其中l(wèi)為句子固定長(zhǎng)度,score(xi,xj)是詞向量xi和xj, i≠j的相似性得分,表示如下:
然后將詞向量和其對(duì)應(yīng)的上下文向量拼接為擴(kuò)展詞向量,更新到嵌入矩陣中,其中,詞向量xi的擴(kuò)展詞向量Xi表示如下:
其中1≤i≤l,l為句子固定長(zhǎng)度,表示向量之間的串聯(lián)拼接符號(hào);
基于同樣方法,計(jì)算得到通道2的詞向量yi1≤i≤l的上下文向量vi,yi的擴(kuò)展詞向量Yi;
3.3文本特征抽取和類(lèi)別輸出
雙通道詞嵌入矩陣C∈R2×l×d經(jīng)過(guò)Attention機(jī)制對(duì)詞向量的重新編碼后,更新后的嵌入矩陣變?yōu)镈∈R2×l×2d,表示如下:
其中,∪表示向量并行拼接符號(hào),l為句子固定長(zhǎng)度,表示兩個(gè)通道上的擴(kuò)展詞向量Xk和Yk在空間維度上的合并;
然后使用窗口大小為h,深度為2的多個(gè)卷積核在雙通道嵌入矩陣上進(jìn)行滑動(dòng)卷積操作,得到卷積核提取的特征圖,再對(duì)特征圖進(jìn)行最大池化操作,將池化得到的主要特征展開(kāi)成特征向量ξ,以ξ作為全連接層的輸入,經(jīng)過(guò)全連接層和Softmax層得到文本所屬類(lèi)別的概率分布。
2.根據(jù)權(quán)利要求1所述的一種基于Attention機(jī)制的多通道的文本分類(lèi)方法,其特征在于:
所述步驟3.1中構(gòu)建句子的詞向量表示具體為:以詞的數(shù)目表示句子長(zhǎng)度,設(shè)置句子固定長(zhǎng)度為l,對(duì)于大于句長(zhǎng)l的句子截?cái)啵∮诰溟L(zhǎng)l的句子用“PAD”填充。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911191475.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種融入Attention機(jī)制的長(zhǎng)文本情感分析方法
- 一種基于Attention機(jī)制和卷積神經(jīng)網(wǎng)絡(luò)的快速商標(biāo)圖像檢索方法
- 一種基于Attention機(jī)制來(lái)構(gòu)建老撾語(yǔ)詞性標(biāo)注模型的方法
- 一種基于雙層attention機(jī)制的詞嵌入方法、設(shè)備及存儲(chǔ)設(shè)備
- 一種attention-attack人臉識(shí)別攻擊算法
- 基于深度卷積神經(jīng)網(wǎng)絡(luò)的番茄病害識(shí)別方法
- 基于Attention機(jī)制的訓(xùn)練圖片壓縮網(wǎng)絡(luò)的構(gòu)建方法及系統(tǒng)
- 一種基于LSTM-Attention的交通流量預(yù)測(cè)方法
- 一種基于Attention+YOLOv3的空調(diào)外機(jī)圖像智能檢測(cè)方法、設(shè)備及介質(zhì)
- 一種基于Attention的CNN神經(jīng)網(wǎng)絡(luò)的行人重識(shí)別方法
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車(chē)市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





