[發明專利]基于神經網絡的人頭檢測方法、系統及存儲介質有效
| 申請號: | 202010080821.6 | 申請日: | 2020-02-05 |
| 公開(公告)號: | CN111368634B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 李榮春;張俊杰;竇勇;姜晶菲;牛新;蘇華友;喬鵬;潘衡岳 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/25;G06V10/82;G06N3/0464;G06N3/096 |
| 代理公司: | 北京辰權知識產權代理有限公司 11619 | 代理人: | 付婧 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 人頭 檢測 方法 系統 存儲 介質 | ||
1.一種基于神經網絡的人頭檢測方法,其特征在于,包括以下步驟:
輸入被測圖像至深度殘差網絡提取得到特征響應圖;
輸入所述特征響應圖至空間注意力網絡得到注意力圖,所述注意力圖用于增強所述特征響應圖得到增強特征響應圖;
輸入所述增強特征響應圖至區域生成網絡RPN得到候選框;
根據所述候選框的特征得到人頭檢測結果;根據損失函數對之前的步驟進行訓練,所述損失函數包括特征模擬損失函數;
其中,所述特征模擬損失函數的計算步驟包括:
輸入所述候選框的特征以及特征響應圖至另一區域生成網絡RPN得到進一步分類候選框特征;
將深層級聯分類網絡嵌入在分類網絡中,對所述進一步分類候選框特征做重分類得到級聯分類網絡特征;
計算所述級聯分類網絡特征與所述候選框的特征之間余弦距離;
根據所述余弦距離以及級聯分類損失函數得到特征模擬損失函數。
2.根據權利要求1所述的基于神經網絡的人頭檢測方法,其特征在于,所述空間注意力網絡結構具體為:
所述特征響應圖通過三個3×3的卷積層進行分層提取特征,所述每個3×3的卷積層帶有256個內核;所述特征響應圖通過一個帶有256個內核的1×1卷積層保持初始的特征;連接所述分層提取的特征與所述初始的特征;最后,通過一個1×1的卷積層,所述1×1的卷積層的輸入通道大小等于所述分類網絡提取的特征的通道大小。
3.根據權利要求1所述的基于神經網絡的人頭檢測方法,其特征在于,所述根據所述候選框的特征得到人頭檢測結果后,還包括:
根據損失函數對之前步驟進行訓練,所述損失函數包括特征模擬損失函數Lm,所述特征模擬損失函數Lm公式為:
其中i表示候選框,u(i)表示輸入所述候選框i至深層級聯分類網絡后得到的分類特征,v(i)表示輸入所述候選框i至感興趣區域池化得到的候選框特征,Lcls(.)表示級聯分類損失函數,Φ表示抽樣的候選框,p表示候選框為人頭的預測概率,p*表示候選框的標簽屬性,p*=1時為正樣本,p*=0時為正樣本。
4.根據權利要求1所述的基于神經網絡的人頭檢測方法,其特征在于,所述根據所述候選框的特征得到人頭檢測結果后,還包括:
根據損失函數對之前步驟進行訓練,所述損失函數包括分類網絡檢測損失函數以及空間注意力網絡的交叉熵函數。
5.根據權利要求1或4任一項所述的基于神經網絡的人頭檢測方法,其特征在于,所述損失函數L公式具體為:
L=Ldet+λ1La+λ2Lm;
其中,La表示空間注意力網絡的交叉熵函數,Ldet表示分類網絡檢測損失函數,Lm表示特征模擬損失函數,λ1和λ2表示損失權重平衡參數;
交叉熵函數La的公式為:
其中,xj是注意力圖中生成的像素,表示xj的標簽,當時,意味著xj被包含在人的頭部區域中,當時,意味著xj不被包含在人的頭部區域中。
6.根據權利要求1所述的基于神經網絡的人頭檢測方法,其特征在于,所述注意力圖通過逐元素計算來激活輸入特征響應。
7.根據權利要求1所述的基于神經網絡的人頭檢測方法,其特征在于,所述輸入所述特征響應圖至空間注意力網絡得到注意力圖還包括:
輸入利用邊界框生成訓練樣本至所述空間注意力網絡,所述注意力圖的尺寸與所述特征響應圖的尺寸相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010080821.6/1.html,轉載請聲明來源鉆瓜專利網。





