[發(fā)明專利]一種融入注意力的殘差網(wǎng)絡(luò)表情識別方法有效
| 申請?zhí)枺?/td> | 202011374602.5 | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112541409B | 公開(公告)日: | 2021-09-14 |
| 發(fā)明(設(shè)計)人: | 譚志;史志博 | 申請(專利權(quán))人: | 北京建筑大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市商泰律師事務(wù)所 11255 | 代理人: | 劉源 |
| 地址: | 100044*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融入 注意力 網(wǎng)絡(luò) 表情 識別 方法 | ||
1.一種融入注意力的殘差網(wǎng)絡(luò)表情識別方法,其特征在于,包括將特征圖輸入到卷積塊注意力模塊中進(jìn)行處理和將卷積塊注意力模塊融入到殘差學(xué)習(xí)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練;
所述的將特征圖輸入到卷積塊注意力模塊中進(jìn)行處理包括:
S1獲取特征圖,通過通道注意力模塊處理該特征圖,獲得通道注意力權(quán)重系數(shù);所述通道注意力模塊中具有第一拼接融合器,用于將池化處理后的特征圖在進(jìn)行權(quán)重訓(xùn)練之前進(jìn)行拼接融合處理;
S2將所述特征圖與所述通道注意力權(quán)重系數(shù)相乘,獲得通道維度關(guān)鍵信息特征圖;
S3通過空間注意力模塊處理該通道維度關(guān)鍵信息特征圖,獲得空間注意力權(quán)重系數(shù);
S4將所述空間注意力權(quán)重系數(shù)與通道維度關(guān)鍵信息特征圖相乘,獲得空間位置關(guān)鍵信息特征圖;
所述的將卷積塊注意力模塊融入到殘差學(xué)習(xí)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練包括:
S5將卷積塊注意力模塊與殘差學(xué)習(xí)網(wǎng)絡(luò)中的特征提取層進(jìn)行融合,分別構(gòu)建下采樣卷積模塊和殘差注意力模塊,通過該下采樣卷積模塊和殘差注意力模塊訓(xùn)練所述卷積塊注意力模塊,獲得特征圖表情識別結(jié)果;
構(gòu)建所述下采樣卷積模塊的過程包括:
S51將所述卷積塊注意力模塊的輸出依次通過殘差學(xué)習(xí)網(wǎng)絡(luò)中的三個卷積層進(jìn)行卷積操作;
S52對所述特征圖通過一個卷積層進(jìn)行卷積操作;
S53將S51和S52的處理結(jié)果進(jìn)行加和運算,再進(jìn)行一次Relu函數(shù)處理;
構(gòu)建所述殘差注意力模塊的過程包括:
S54將所述卷積塊注意力模塊的輸出依次通過殘差學(xué)習(xí)網(wǎng)絡(luò)中的三個卷積層進(jìn)行卷積操作;
S55將S54的處理結(jié)果結(jié)合所述特征圖進(jìn)行加和運算,再進(jìn)行一次Relu函數(shù)處理;
所述的通過該下采樣卷積模塊和殘差注意力模塊訓(xùn)練所述卷積塊注意力模塊,獲得特征圖表情識別結(jié)果包括:
基于該下采樣卷積模塊和殘差注意力模塊訓(xùn)練所述卷積塊注意力模塊建立殘差注意力調(diào)和網(wǎng)絡(luò)模型;該殘差注意力調(diào)和網(wǎng)絡(luò)模型由一個卷積層、一個最大池化層、3個所述下采樣卷積模塊、13個所述殘差注意力模塊、一個平均池化層和一個全連接層構(gòu)成;
將待處理的表情圖像輸入到該殘差注意力調(diào)和網(wǎng)絡(luò)模型中進(jìn)行處理,再通過Softmax分類器進(jìn)行分類識別,獲得所述特征圖表情識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟S1具體包括:
S11將特征圖分別通過第一全局平均池化層和第一最大池化層進(jìn)行壓縮,獲得第一池化特征和第二池化特征;
S12將該第一池化特征和第二池化特征通過所述第一拼接融合器進(jìn)行拼接融合,獲得第一融合特征;
S13將該第一融合特征通過多層感知機(jī)進(jìn)行降維升維處理,再通過Sigmoid函數(shù)進(jìn)行激活處理,獲得所述通道注意力權(quán)重系數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟S13中,所述的通過多層感知機(jī)進(jìn)行降維升維處理包括:
將所述第一融合特征輸入第一FC層,通過Y0=W0×X進(jìn)行降維處理,獲得降維后的第一融合特征Y0;式中,X為所述第一融合特征,W0為第一FC層的權(quán)重;
將該降維后的第一融合特征Y0輸入第二FC層,通過Y1=W1×Y0進(jìn)行升維處理,獲得輸出特征Y1。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述通道注意力模塊的處理過程包括NC(A)=σ(MLP([MaxPool(A);AvgPool(A)]);
式中,[MaxPool(A);AvgPool(A)]為所述融合特征,NC(A)為所述通道注意力權(quán)重系數(shù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,步驟S2包括:
S21通過獲得所述通道維度關(guān)鍵信息特征圖;A為輸入到通道注意力模塊的特征圖,A′為通道維度關(guān)鍵信息特征圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京建筑大學(xué),未經(jīng)北京建筑大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011374602.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種增強(qiáng)尼龍包容鋼齒輪
- 一種增強(qiáng)尼龍包容鋼齒輪
- 融入式市場系統(tǒng)和方法
- 煤矸石淋濾液消融入滲土柱模擬系統(tǒng)及特征參數(shù)測定方法
- 煤矸石淋濾液消融入滲室內(nèi)土柱模擬裝置
- 將句子權(quán)重融入神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法
- 融入依存關(guān)系的神經(jīng)機(jī)器翻譯方法
- 基于虛擬現(xiàn)實及多模態(tài)信息的孤獨癥輔助干預(yù)系統(tǒng)及方法
- 一種基于生成對抗網(wǎng)絡(luò)的視頻廣告融入系統(tǒng)與方法
- 基于融入空間信息的加權(quán)伽馬混合模型的SAR影像分割方法
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





