[發(fā)明專利]一種基于注意力機制的人臉檢測神經(jīng)網(wǎng)絡的構(gòu)建方法有效
| 申請?zhí)枺?/td> | 202010115987.7 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111325161B | 公開(公告)日: | 2023-04-18 |
| 發(fā)明(設計)人: | 韓強;閆超 | 申請(專利權(quán))人: | 四川翼飛視科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 成都佳劃信知識產(chǎn)權(quán)代理有限公司 51266 | 代理人: | 史姣姣 |
| 地址: | 610000 四川省成都市高新*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 機制 檢測 神經(jīng)網(wǎng)絡 構(gòu)建 方法 | ||
本發(fā)明公開了一種基于注意力機制的人臉檢測神經(jīng)網(wǎng)絡的構(gòu)建方法,包括以下步驟:采用卷積層和激活層組成注意力模塊;從前至后按卷積層、批歸一化層、激活層和注意力模塊的順序封裝得到網(wǎng)絡單塊;利用并行的卷積層和與其中之一的卷積層連接的激活層組成回歸模塊;將數(shù)個網(wǎng)絡單塊依次連接,并將最后一層的網(wǎng)絡單塊和倒數(shù)第二層的網(wǎng)絡單塊的輸出一一對應介入兩個并行的回歸模塊;將所述兩個并行的回歸模塊的輸出與坐標換算和非極大抑制模塊連接,得到人臉檢測神經(jīng)網(wǎng)絡。
技術(shù)領域
本發(fā)明涉及人臉檢測技術(shù)領域,尤其是一種基于注意力機制的人臉檢測神經(jīng)網(wǎng)絡的構(gòu)建方法。
背景技術(shù)
人臉檢測主要應用于通行確權(quán)、考勤、安防等等領域。人臉檢測技術(shù)要求能夠從各種復雜的背景場景中,準確的識別出人臉出現(xiàn)的區(qū)域,以便后續(xù)進行處理。目前,現(xiàn)有技術(shù)中主流的人臉檢測方法有基于人工構(gòu)造的特征提取方法和基于深度學習的檢測算法。其中,基于深度學習的算法由于檢測的準確度和召回率都更為優(yōu)異,使用越來越廣泛。
深度學習的人臉檢測方法,首先,需要有大量的訓練圖片樣本,這些圖片中所有人臉出現(xiàn)的位置,都需要進行標注。然后,搭建神經(jīng)網(wǎng)絡,對這些圖片樣本進行學習。訓練結(jié)束后,網(wǎng)絡能夠?qū)D片提取特征,根據(jù)提取的特征判斷圖片中是否包含有人臉,以及人臉的坐標位置。目前,很多基于深度學習的人臉檢測方法,有很好的特征提取能力(其前提條件是無遮擋的人臉),因此能很好的進行檢測。然而,而對于部分遮擋的人臉(如佩戴有口罩,眼鏡,帽子等),由于圖片中人臉特征信息變少,并且干擾信息增多,檢測能力會有明顯的下降。人類在觀察圖片時,會有一個注意力的策略,即首先找出圖中可能出現(xiàn)人臉的區(qū)域,然后聚集在這些區(qū)域上做進一步的觀測判斷,無關的背景信息則被忽略。如果能夠?qū)⑷祟愑^察圖片時所采用的這一策略應用到神經(jīng)網(wǎng)絡上,特別時對部分遮擋人臉,將關注的重點放在未被遮擋的人臉部分,獲取有效的人臉特征信息,忽略掉無關的背景和干擾,就可能提升神經(jīng)網(wǎng)絡的性能。
在圖像分類鄰域中,有一些基于注意力機制的方法,用以改善圖像分類算法的精度。但這些方法很多都會引入大量的計算量,很多也不適于在人臉檢測鄰域。
因此,急需要提出一種結(jié)構(gòu)簡單、構(gòu)建便捷、節(jié)省計算資源的神經(jīng)網(wǎng)絡的構(gòu)建方法,改善對部分遮擋的人臉檢測性能,同時保持高水平的正常人臉檢測性能。
發(fā)明內(nèi)容
針對上述問題,本發(fā)明的目的在于提供一種基于注意力機制的人臉檢測神經(jīng)網(wǎng)絡的構(gòu)建方法,本發(fā)明采用的技術(shù)方案如下:
一種基于注意力機制的人臉檢測神經(jīng)網(wǎng)絡的構(gòu)建方法,包括以下步驟:
采用卷積層和激活層組成注意力模塊,利用注意力模塊計算求得attention?map注意力圖;
從前至后按卷積層、批歸一化層、激活層和注意力模塊的順序封裝得到網(wǎng)絡單塊;
利用并行的卷積層和與其中之一的卷積層連接的激活層組成回歸模塊;
將數(shù)個網(wǎng)絡單塊依次連接,并將最后一層的網(wǎng)絡單塊和倒數(shù)第二層的網(wǎng)絡單塊的輸出一一對應介入兩個并行的回歸模塊;
將所述兩個并行的回歸模塊的輸出與坐標換算和非極大抑制模塊連接,得到人臉檢測神經(jīng)網(wǎng)絡。
進一步地,所述注意力模塊的輸出結(jié)果計算如下:
利用注意力模塊的特征輸入張量,計算獲得一個與特征輸入張量大小相同、且通道為1的一個attentionmap注意力圖;
利用attention?map注意力圖的結(jié)果與特征輸入張量的相乘,得到注意力模塊的輸出結(jié)果;
所述注意力模塊的輸出結(jié)果的表達式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川翼飛視科技有限公司,未經(jīng)四川翼飛視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010115987.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





