[發明專利]一種基于特征融合和視覺感受野網絡的多尺度人臉檢測方法有效
| 申請號: | 202010418338.4 | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111695430B | 公開(公告)日: | 2023-06-30 |
| 發明(設計)人: | 劉欣剛;王文涵;鐘魯豪;李辰琦;汪衛彬;朱超 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/44;G06V10/774;G06V10/80;G06V10/82 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 鄒裕蓉 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 特征 融合 視覺 感受 網絡 尺度 檢測 方法 | ||
1.一種基于特征融合和視覺感受野網絡的多尺度人臉檢測方法,包括訓練步驟與測試步驟,其特征在于,訓練步驟包括:
S1構建檢測網絡結構:檢測網絡包括特征提取網絡、特征融合網絡、候選框生成模塊以及輸出層;特征提取網絡以VGG-16為基礎網絡連接視覺感受野網絡;
S2特征提取:特征提取網絡接收輸入有標簽的人臉圖像,在網絡的不同層提取特征,獲取多尺度的特征圖;
S3特征融合:特征融合網絡自上而下將來自特征提取網絡高層的特征上采樣后與低層特征結合形成融合特征輸出至候選框生成模塊;
S4生成候選框:候選框生成模塊根據不同層融合特征提取不同尺度候選框;針對低層融合特征圖,采用隨機密集采樣生成更多小尺度候選框;
S5生成訓練樣本:計算各候選框的交并比IoU,根據IoU值與預設值的比較將候選框分成人臉或非人臉樣本;
S6將人臉和非人臉樣本輸入至檢測網絡中進行訓練,檢測網絡中輸出層輸出候選框位置與候選框的人臉/非人臉二分類結果并計算損失后反饋至檢測網絡直至完成訓練;
其中,特征提取網絡以VGG-16為基礎網絡連接視覺感受野網絡的具體方法是:
S11:去除VGG-16的最后3個全連接層,只保留前13個卷積層作為VGG-16基礎網絡;
S12:在VGG-16基礎網絡后,連接2個視覺感受野網絡;在視覺感受野網絡后再連接1個空洞卷積層和2個普通卷積層;
所述視覺感受野網絡由4個并行的子網絡組成;第1個子網絡分別進行卷積核為1×1、3×3的卷積操作和2個卷積核為3×3、擴張率為2的空洞卷積操作;
第2個子網絡分別進行3×3的最大池化、卷積核1×1的卷積和卷積核為3×3、擴張率為1的空洞卷積操作;第3個子網絡分別進行卷積核為1×1、3×3的卷積操作和卷積核為3×3、擴張率為2的空洞卷積操作;第4個子網絡分別進行卷積核為1×1、3×3、3×3的卷積操作和卷積核為3×3、擴張率為3的空洞卷積層;4個子網絡進行特征拼接,然后經過1×1的卷積操作,輸出結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010418338.4/1.html,轉載請聲明來源鉆瓜專利網。





