[發明專利]一種基于混合注意力機制的人臉識別檢測方法有效
| 申請號: | 202011392413.0 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112200161B | 公開(公告)日: | 2021-03-02 |
| 發明(設計)人: | 劉晨;楊濤 | 申請(專利權)人: | 北京電信易通信息技術股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中索知識產權代理有限公司 11640 | 代理人: | 陳江 |
| 地址: | 100195 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 混合 注意力 機制 識別 檢測 方法 | ||
1.一種基于混合注意力機制的人臉識別檢測方法,其特征在于,包括以下步驟:
S1、構建人臉目標圖像數據集;
S2、采用所述人臉目標圖像數據集的訓練集和驗證集訓練構建的深度神經網絡模型;
S3、將人臉目標圖像數據集中的測試集用于訓練好的深度神經網絡模型中以檢測圖像中的人類面部目標;
其中,所述S2步驟,包括以下步驟:
S21、構建混合注意力模塊,并嵌入Faster R-CNN網絡結構的ResNet101中;
所述混合注意力模塊的構建方法包括:
S211、設計空間域注意力模塊結構;
S212、設計通道域注意力模塊結構;
S213、設計基于FPN的Faster R-CNN結構;
所述ResNet101由五個卷積模塊conv1、conv2、conv3、conv4、conv5組成;采用其中前4個模塊的輸出特征圖,表示為C2、C3、C4、C5,分別經過卷積核1×1的卷積層,采用多尺度特征融合方式,將上一層低分辨率強語義信息的特征圖通過2倍縮放上采樣得到與下層同尺寸的特征圖,C2至C5特征圖的分辨率大小依次為:256×256×256、128×128×512、64×64×1024、32×32×2048;
所述嵌入Faster R-CNN網絡結構的ResNet101中,是將構建的混合注意力模塊,嵌入conv1與conv2之間,以便使后續特征圖都包含注意力模塊所感知的關鍵信息,其經過conv1后輸出特征圖尺寸為256×256;
S22、將FPN應用在Faster R-CNN網絡結構的ResNets101中;
所述FPN網絡結構為一個3×3卷積層和兩個輸出支路;第一個輸出支路輸出候選區域為目標的可能性概率,第二個輸出支路輸出候選區域邊框bounding box的左上角坐標和寬高;
S23、構建SENet注意力模塊,并將SENet注意力模塊嵌入所述S22步驟已經得到的網絡結構中,得到金字塔注意力網絡;
所述構建SENet注意力模塊,并將SENet注意力模塊嵌入所述S22步驟已經得到的網絡結構中,得到金字塔注意力網絡,是通過對輸入特征圖基于通道維度進行全局平均池化,輸入一個全連接層將通道數縮減為原來的r分之一,采用ReLU激活函數對此特征圖進行激活操作,輸入第二個全連接層將通道數擴充回原數,經過Sigmoid函數將k層特征圖的權重限制到[0,1]的范圍;輸出特征圖的k個通道與該輸出權重1×1×k相乘,從而輸出包含通道域注意力信息的特征圖,SENet注意力模塊的計算公式如下:
,
其中,X表示注意力模塊的輸入特征圖,Y為輸出特征圖,FC表示全連接層,為sigmoid激活函數;
S24、采用人臉目標圖像數據集進行金字塔注意力網絡的訓練及參數優化,直至達到人臉識別檢測的準確率參數。
2.根據權利要求1所述的人臉識別檢測方法,其特征在于,所述S1步驟中,所述構建人臉目標圖像數據集的方法包括:先采用Labellmg軟件進行圖像標注,然后采用仿射變換對人臉圖像進行數量擴充。
3. 根據權利要求1所述的人臉識別檢測方法,其特征在于,所述空間域注意力模塊的構建方法包括:對輸入特征圖基于通道維度分別進行全局最大池化和全局平均池化,基于通道維度進行拼接,卷積降維,經過sigmoid激活函數生成空間域注意力特征圖,計算公式為:,
其中X表示注意力模塊的輸入特征圖,Y為輸出特征圖,f^(7*7)表示卷積核大小為7*7的卷積層,σ為sigmoid激活函數。
4. 根據權利要求1所述的人臉識別檢測方法,其特征在于,所述通道域注意力模塊的構建方法包括:將經過所述空間域注意力模塊后的輸出特征圖,經過全局最大池化和全局平均池化,經過多層感知器,將多層感知器的輸出特征圖進行元素級的加和操作,經過sigmoid激活函數進行激活,生成通道域注意力特征圖,計算公式為:,
其中X表示注意力模塊的輸入特征圖,Y為輸出特征圖,MLP表示多層感知器,σ為sigmoid激活函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京電信易通信息技術股份有限公司,未經北京電信易通信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011392413.0/1.html,轉載請聲明來源鉆瓜專利網。





