[發(fā)明專利]一種基于改進(jìn)損失函數(shù)的MDSSD人臉檢測方法有效
| 申請?zhí)枺?/td> | 202011047720.5 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112163520B | 公開(公告)日: | 2022-02-15 |
| 發(fā)明(設(shè)計(jì))人: | 王智文;安曉寧;王宇航 | 申請(專利權(quán))人: | 廣西科技大學(xué) |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/762;G06V10/774;G06V10/764;G06K9/62 |
| 代理公司: | 南京禹為知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32272 | 代理人: | 朱寶慶 |
| 地址: | 545006 廣西壯族*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) 損失 函數(shù) mdssd 檢測 方法 | ||
1.一種基于改進(jìn)損失函數(shù)的MDSSD人臉檢測方法,其特征在于:包括,
MDSSD網(wǎng)絡(luò)利用先驗(yàn)框機(jī)制對人臉區(qū)域檢測并對候選區(qū)域進(jìn)行分類和框回歸;
根據(jù)k-means對Ground Truth框進(jìn)行聚類分析,尋找最佳的先驗(yàn)框數(shù)量、大小和比例;
所述MDSSD網(wǎng)絡(luò)將Focalloss代替分類網(wǎng)絡(luò)中的交叉熵?fù)p失函數(shù),對聚類分析后的所述先驗(yàn)框進(jìn)行人臉和背景的檢測分類;所述MDSSD網(wǎng)絡(luò)包括,
對深層特征圖或深層融合層進(jìn)行0填充,結(jié)合3*3卷積對填充特征圖進(jìn)行反卷積運(yùn)算,在保證感受野范圍不變的條件下使所述特征圖的分辨率翻倍;
利用與淺層特征圖通道維度相同的卷積核數(shù)量以保證所述反卷積運(yùn)算輸出維度與所述淺層融合特征圖維度匹配;
MDSSD特征融合時(shí)只對所述淺層特征圖與反卷積特征圖對應(yīng)位置進(jìn)行相加運(yùn)算,以增強(qiáng)有效上下文信息;
所述MDSSD通過在融合層添加激活層以進(jìn)行非線性映射,并將激活后的所述融合層作為最終的檢測特征圖;
包括,
所述MDSSD網(wǎng)絡(luò)將SSD作為基礎(chǔ)網(wǎng)絡(luò)模型;
剔除SSD網(wǎng)絡(luò)中Block6和Block7的dropout層;
添加多層融合Mixedlayer3和單層融合Mixedlayer4和Mixedlayer7;
所述MDSSD網(wǎng)絡(luò)模型還增加了L2Normalization層以減小與檢測層的差異;
所述先驗(yàn)框機(jī)制需要考慮有效感受野,包括,
卷積神經(jīng)網(wǎng)絡(luò)中層與層之間均為局部相連,使得神經(jīng)元無法對原始圖像的所有信息進(jìn)行感知;
若所述感受野越大,則獲取的全局信息越多,即所述特征圖所包含的全局的、高級的語義特征越豐富;
若神經(jīng)元感受野越小,則所述特征圖所包含的特征越低級,所包含的信息更多是局部和紋理;
還包括,
所述先驗(yàn)框需要與所述Ground Truth框進(jìn)行匹配以劃分正負(fù)樣本;
若所述先驗(yàn)框大小、比例與真實(shí)的所述Ground Truth框差距越大,則計(jì)算交并比的誤差越大;
若所述先驗(yàn)框大小、比例與真實(shí)的所述Ground Truth框差距越小,則計(jì)算交并比的誤差越小。
2.根據(jù)權(quán)利要求1所述的基于改進(jìn)損失函數(shù)的MDSSD人臉檢測方法,其特征在于:利用自定義IOU距離作為度量距離進(jìn)行所述聚類分析,包括,
dIOU(box,centroid)=1-IOU(box,centroid)
聚類的損失是所述Ground Truth框與簇中心的所述IOU距離,若所述IOU距離越小,則IOU值越大;
定義簇?cái)?shù)k并隨機(jī)初始化簇中心(Wi,Hi),i∈{1,2,…,k},其中,Wi,Hi分別表示簇中心的長和寬;
將所述簇中心與所述Ground Truth框中心置于坐標(biāo)原點(diǎn)并計(jì)算每個(gè)Ground Truth框與所述簇的所述IOU距離;
對所述Ground Truth框分配為IOU距離最小的簇,當(dāng)所有的所述Ground Truth框分配完畢后重新計(jì)算所述簇中心;
不斷更新直至所述簇中心不再改變,將所述簇中心的中位數(shù)作為最終的先驗(yàn)框大小和比例。
3.根據(jù)權(quán)利要求2所述的基于改進(jìn)損失函數(shù)的MDSSD人臉檢測方法,其特征在于:還包括,
利用肘策略確定最佳的簇?cái)?shù),當(dāng)k=17時(shí),所述損失函數(shù)下降緩慢趨于平穩(wěn),綜合考慮各個(gè)檢測層設(shè)置,確定最佳聚類簇?cái)?shù)為17。
4.根據(jù)權(quán)利要求3所述的基于改進(jìn)損失函數(shù)的MDSSD人臉檢測方法,其特征在于:所述損失函數(shù)包括,
其中,x為樣本標(biāo)簽,y'為模型輸出值,α為樣本平衡因子,γ是樣本權(quán)重調(diào)節(jié)因子。
5.根據(jù)權(quán)利要求4所述的基于改進(jìn)損失函數(shù)的MDSSD人臉檢測方法,其特征在于:還包括,
當(dāng)x=1時(shí),即輸入為正樣本,則預(yù)測值越大,所述樣本越容易分類,且樣本權(quán)重越小。
6.根據(jù)權(quán)利要求5所述的基于改進(jìn)損失函數(shù)的MDSSD人臉檢測方法,其特征在于:還包括,
所述樣本平衡因子α可以調(diào)節(jié)正負(fù)樣本在損失函數(shù)中的比重,且在模型訓(xùn)練過程中設(shè)置α=0.25,γ=2。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣西科技大學(xué),未經(jīng)廣西科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011047720.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





