[發明專利]一種基于混合注意力機制的人臉識別檢測方法有效
| 申請號: | 202011392413.0 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112200161B | 公開(公告)日: | 2021-03-02 |
| 發明(設計)人: | 劉晨;楊濤 | 申請(專利權)人: | 北京電信易通信息技術股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中索知識產權代理有限公司 11640 | 代理人: | 陳江 |
| 地址: | 100195 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 混合 注意力 機制 識別 檢測 方法 | ||
本發明提供了一種基于混合注意力機制的人臉識別檢測方法,包括:構建人臉目標圖像數據集;采用所述人臉目標圖像數據集的訓練集和驗證集訓練設計的深度神經網絡模型;將人臉目標圖像數據集中的測試集用于訓練好的深度神經網絡模型中以檢測圖像中的人類面部目標。本發明采用混合注意力模塊提煉關鍵檢測特征,將該關鍵特征傳遞至后面的層,提高檢測準確率;建立基于FPN的Faster RCNN網絡,采用多尺度特征融合技術提取豐富的細節信息,增強了網絡對人臉特征的表征能力;構建并將SENet注意力模塊嵌入FPN,有助于網絡過濾冗余的特征信息,并將關鍵特征傳遞至RPN網絡,提高了人臉識別檢測精度。
技術領域
本發明涉及圖像處理技術領域,具體而言,涉及一種基于混合注意力機制的人臉識別檢測方法。
背景技術
隨著計算機技術的飛速發展,生物特征識別作為計算機視覺領域內的一個獨立的研究課題得到廣泛研究,而人臉識別檢測則作為生物特征識別的一大分支成為熱門研究方向。人臉識別檢測是指對于任意一幅給定的圖像,采用一定的策略對其進行搜索以確定其中是否含有一個或多個人臉,如果是,則返回人臉所在位置的檢測任務(王飛龍.人臉識別技術及其安全性綜述[J].信息記錄材料,2018,19(12):229-230.);該技術目前已在圖像搜索、身份認證以及安全防護等多個領域得到廣泛的應用(嚴陳. 人臉識別檢測算法研究及驗證[D].揚州大學,2019.)。由于人臉屬于非剛性目標,且長相、年齡、表情、裝扮等原因導致其個體差異較大,分辨和提取有效的面部特征難度大,在車站、公路等復雜背景下由于拍攝距離的影響增加了檢測難度,這使得人臉識別檢測成為生物特征識別領域的研究熱點及難點。
多尺度特征融合技術作為一種有效的特征增強機制,可得到兼具語義信息與細節信息的融合特征,從而有效提升神經網絡對目標的定位效果和檢測精度(任坤,黃瀧,范春奇,高學金.基于多尺度像素特征融合的實時小交通標志檢測算法[J/OL].信號處理:1-9)。但僅充分提取目標特征信息,而不對所提取到的豐富信息進行關鍵特征篩選,仍難以實現準確識別復雜檢測背景下的人臉目標。因此,探索能實現人臉精確識別和定位的技術途徑,具有重要的研究意義和應用價值。
在人臉識別檢測這一復雜檢測任務中,極大的個體特征信息差異和變化的視覺檢測面積,使得現有人臉識別檢測的深度神經網絡難以提取到有效特征信息,從而導致目標漏檢和定位錯誤,因此有效捕捉人臉目標的關鍵識別特征極其重要。
發明內容
鑒于此,本發明針對人臉目標的識別檢測難點,將多尺度特征融合技術的特征提取能力與注意力機制的關鍵信息感知能力相結合,設計了基于特征金字塔 (FeaturePyramid Network, FPN)的Faster R-CNN網絡結構,針對整張圖像數據進行人臉識別檢測,并在該網絡中嵌入多種注意力模塊分別基于空間域和通道域,有效提取人臉關鍵特征信息,提高深度神經網絡對人臉識別檢測的準確率。
本發明提供了一種基于混合注意力機制的人臉識別檢測方法,包括以下步驟:
S1、構建人臉目標圖像數據集;
首先利用網絡爬蟲獲取包含人臉的圖像數據并進行預處理;其次采用Labellmg軟件進行圖像標注,得到xml格式的標注文件;接下來,采用仿射變換對人臉圖像進行數量擴充,得到人臉圖像數據集;最后,將數據集分為訓練集和測試集,為訓練集中的數據制作標簽,測試集中的數據不作處理;
S2、采用所述人臉目標圖像數據集的訓練集和驗證集訓練設計的深度神經網絡模型;
S3、將人臉目標圖像數據集中的測試集用于訓練好的深度神經網絡模型中以檢測圖像中的人類面部目標;
其中,所述S2步驟,包括以下步驟:
S21、構建混合注意力模塊,并嵌入Faster R-CNN網絡結構的ResNet101中;
S22、將FPN應用在Faster R-CNN網絡結構的ResNets101中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京電信易通信息技術股份有限公司,未經北京電信易通信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011392413.0/2.html,轉載請聲明來源鉆瓜專利網。





