[發明專利]無約束場景下的基于上下文推理的人臉檢測方法在審
| 申請號: | 202010531633.0 | 申請日: | 2020-06-11 |
| 公開(公告)號: | CN111898410A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 徐琴珍;楊哲;邵文韜;劉茵茵;侯坤林;朱穎;楊綠溪 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 葉涓涓 |
| 地址: | 211189 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 無約束 場景 基于 上下文 推理 檢測 方法 | ||
1.無約束場景下的基于上下文推理的人臉檢測方法,其特征在于,包括如下步驟:
步驟1,對WIDERFACE訓練集進行數據增廣;
步驟2,基于步驟1的增廣圖片,以VGGNet-16作為基礎特征提取網絡,通過低層級特征金字塔網絡加權地融合不同層的特征,并在預測環節采用上下文輔助預測模塊擴充子網絡,進而加深、加寬網絡模型;
步驟3,在訓練參數初始化后,應用多尺度訓練方法指導模型的自主學習過程,當損失收斂后保存模型,并進行檢測。
2.根據權利要求1所述的無約束場景下的基于上下文推理的人臉檢測方法,其特征在于,所述步驟1具體包括如下子步驟:
步驟1.1:對WIDERFACE訓練集中的圖片進行水平翻轉和隨機裁剪,作為初步預處理,具體操作為:首先將輸入圖像擴展為原先尺寸的4倍,接著再對每一張圖片進行鏡像水平翻轉,最后隨機地裁剪出640×640的區域大小,即應用下式進行處理:
xpreprocess=Crop(Flip(Extend(xinput)))
式中,xinput表示輸入的訓練集圖片,Extend操作是采用填充均值的方式進行圖片擴展,Flip操作表示隨機地進行水平翻轉,Crop為隨機裁剪操作,xpreprocess則表示相應的初步預處理結果,其尺寸統一為640×640;
步驟1.2:采用色彩抖動、噪聲擾動方式來模擬無約束場景下的干擾,再次對步驟1.1中得到的初步預處理結果xpreprocess進行不同程度地增強,進而得到綜合處理后的增廣圖片xprocess,如下式所示:
式中,Color操作表示色彩抖動方式,Noise(Gaussian)、Noise(Saltpepper)操作分別表示為圖片加高斯噪聲、椒鹽噪聲;
步驟1.3:采用自適應錨點取樣方法對某圖像中的人臉進行重塑,以此引入具有更高概率的更大人臉,具體操作為:在某一圖像中選取一個大小為sface的人臉,預設第i層特征圖上的錨點尺度si如下式所示:
si=24+i
其中,i=0,1,…,5;
將第i層特征圖上與人臉大小sface最接近的錨點的索引表示為:
其中,為第i層特征圖的錨點尺度;
之后再在集合{max(0,ianchor-1),1,…,min(5,ianchor+1)}中依次選取索引iresult,最后將原圖sface調整大小至sresult:
以此得到該圖像的整體尺寸的縮放比例為s*:
s*=sresult/sface
通過將原始樣本圖片按照s*縮放后,再隨機裁剪出包含了選中人臉的640×640區域,即為經過自適應錨點取樣后的訓練樣本圖片。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010531633.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種便于移動和清洗的家用小型污水處理設備
- 下一篇:信息獲取方法及電子設備





