[發明專利]無約束場景下的基于特征強化的漸進式級聯人臉檢測方法在審
| 申請號: | 202010319149.1 | 申請日: | 2020-04-21 |
| 公開(公告)號: | CN111553230A | 公開(公告)日: | 2020-08-18 |
| 發明(設計)人: | 徐琴珍;楊哲;劉楊;王路;王馭揚;楊綠溪 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 葉涓涓 |
| 地址: | 211189 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 無約束 場景 基于 特征 強化 漸進 級聯 檢測 方法 | ||
1.無約束場景下的基于特征強化的漸進式級聯人臉檢測方法,其特征在于,包括如下步驟:
步驟1,對WIDERFACE訓練集進行數據增廣;
步驟2,基于步驟1的增廣圖片,以VGGNet-16作為基礎特征提取網絡,利用特征強化模塊實現雙分支架構,并對用于預測的各分支、各層級特征圖應用Max-Both-Out策略;
步驟3,在訓練參數初始化后,搭建迭代式級聯結構,利用漸進式損失指導和監督模型的自主學習過程,待模型收斂后保存,并進行檢測。
2.根據權利要求1所述的無約束場景下的基于特征強化的漸進式級聯人臉檢測方法,其特征在于,所述步驟1具體包括如下子步驟:
步驟1.1:對WIDERFACE訓練集中的圖片進行水平翻轉和隨機裁剪,作為初步預處理,具體操作為:首先將輸入圖像擴展為原先尺寸的4倍,接著再對每一張圖片進行鏡像水平翻轉,最后隨機地裁剪出640×640的區域大小,即應用下式進行處理:
xpreprocess=Crop(Flip(Extend(xinput)))
式中,xinput表示輸入的訓練集圖片,Extend操作是采用填充均值的方式進行圖片擴展,Flip操作表示隨機地進行水平翻轉,Crop為隨機裁剪操作,xpreprocess則表示相應的初步預處理結果,其尺寸統一為640×640;
步驟1.2:采用色彩抖動、噪聲擾動方式來模擬無約束場景下的干擾,再次對步驟1.1中得到的初步預處理結果xpreprocess進行不同程度地增強,進而得到綜合處理后的增廣圖片xprocess,如下式所示:
式中,Color操作表示色彩抖動方式,Noise(Gaussian)、Noise(Saltpepper)操作分別表示為圖片加高斯噪聲、椒鹽噪聲。
3.根據權利要求1所述的無約束場景下的基于特征強化的漸進式級聯人臉檢測方法,其特征在于,所述步驟2具體包括如下子步驟:
步驟2.1:通過VGGNet-16對增廣的輸入圖片進行基礎特征抽取,其中分別選取conv3_3、conv4_3、conv5_3、conv_fc7、conv6_2、conv7_2作最后的預測,其特征圖尺寸分別為160×160、80×80、40×40、20×20、10×10、5×5;
步驟2.2:利用特征強化模塊實現雙分支架構,通過不同的維度信息,對步驟2.1中用作預測的原始特征圖進行增強,記上層的原始特征圖中的神經元細胞為oc(i,j,l),當前層的原始特征圖中的非局部神經元細胞為nc(i-ε,j-ε,l),nc(i-ε,j,l),…,nci(,j+ε,l),nc(i+ε,j+ε,l),則強化后的特征圖的神經元細胞ec(i,j,l)表示為:
ec(i,j,l)=fConcat(fDilation(nc(i,j,l)))
nc(i,j,l)=fElement-wise(oc(i,j,l),fUp(oc(i,j,l+1)))
式中,c(i,j,l)是第l層的特征圖中坐標為(i,j)所映射的細胞單元,f指向一系列基本的拼接操作、擴張卷積操作、逐元素相乘操作和上采樣操作;
步驟2.3:對上述步驟中所得到的各個分支、各個層級的用作預測的特征圖應用Max-Both-Out策略,降低訓練樣本的假陽性,Max-Both-Out策略同時預測Cp個正樣本人臉分數和Cn個負樣本背景分數,再從中分別選擇正、負分數最高的作為最終的目標、背景,相當于集成了Cn+Cp個分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010319149.1/1.html,轉載請聲明來源鉆瓜專利網。





