[發明專利]一種基于改進損失函數的MDSSD人臉檢測方法有效
| 申請號: | 202011047720.5 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112163520B | 公開(公告)日: | 2022-02-15 |
| 發明(設計)人: | 王智文;安曉寧;王宇航 | 申請(專利權)人: | 廣西科技大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/762;G06V10/774;G06V10/764;G06K9/62 |
| 代理公司: | 南京禹為知識產權代理事務所(特殊普通合伙) 32272 | 代理人: | 朱寶慶 |
| 地址: | 545006 廣西壯族*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 損失 函數 mdssd 檢測 方法 | ||
本發明公開了一種基于改進損失函數的MDSSD人臉檢測方法,包括,MDSSD網絡利用先驗框機制對人臉區域檢測并對候選區域進行分類和框回歸;根據k?means對Ground Truth框進行聚類分析,尋找最佳的先驗框數量、大小和比例;所述MDSSD網絡將Focal loss代替分類網絡中的交叉熵損失函數,對聚類分析后的所述先驗框進行人臉和背景的檢測分類。本發明對標注人臉的Ground Truth框進行聚類分析,以尋找每個檢測層的最佳先驗框數量和比例;同時,本發明訓練了MDSSD模型并對模型進行測試分析,實驗結果顯示,MDSSD算法相對于SSD其對小臉和模糊人臉召回率更高,同時其仍然保持了較快的檢測速度。
技術領域
本發明涉及小臉檢測的技術領域,尤其涉及一種基于改進損失函數的MDSSD人臉檢測方法。
背景技術
隨著深度學習的興起,與人臉相關的智能分析技術成為人工智能領域研究的重點和熱點,新的算法不斷刷新著人臉相關任務的評分,目前人臉識別技術已經超越人類的最高水平,同時與人臉相關的工業應用也是最廣泛的。例如與人臉檢測相關的應用有智能安防、城市大腦、安全駕駛以及中國的天網系統等;與人臉識別的相關應用包括人臉支付、智能門禁、人臉考勤、各種智能終端設備的人臉驗證等,人臉相關的技術與各種系統的安全息息相關。同時與人臉相關的技術也在不斷的應用到生活的方方面面,比如走失兒童尋找、智慧教育等。進一步隨著計算機計算能力的提高和5G網絡的應用,數據儲存的成本和數據傳輸的延時會越來越低,與人臉相關應用會部署到越來越多的智能終端上,真正實現智能社會而造福人類。人臉檢測即智能終端在輸入圖像上判斷是否有人臉存在,并找出人臉所在的位置。人臉檢測技術的前提就是能準確的檢測到人臉,而不受人臉圖像背景的影響。因此人臉檢測作為人臉相關任務的基礎和核心技術,受到研究人員的廣泛關注。
基于SSD算法的人臉檢測模型能快速準確的識別自然場景圖像中的人臉,同時該算法具有較高的檢測速度,但是SSD人臉檢測算法對自然或非自然場景下小臉檢測的召回率仍然有較大的提升空間,因此需要構建新的網絡MDSSD模型,即Mix DeconvolutionSingle ShotMultiBox Detector用于人臉檢測,MDSSD算法對SSD算法在人臉檢測方面的諸多缺點進行改進,包括模型結構、檢測特征圖、參數配置、損失函數等,并通過機器學習方法對模型進行配置以減少人為經驗干預,大幅度提高了模型的檢測效果。
發明內容
本部分的目的在于概述本發明的實施例的一些方面以及簡要介紹一些較佳實施例。在本部分以及本申請的說明書摘要和發明名稱中可能會做些簡化或省略以避免使本部分、說明書摘要和發明名稱的目的模糊,而這種簡化或省略不能用于限制本發明的范圍。
鑒于上述現有存在的問題,提出了本發明。
因此,本發明提供了一種基于改進損失函數的MDSSD人臉檢測方法,能夠解決對自然或非自然場景下小臉檢測的召回率不高的問題。
為解決上述技術問題,本發明提供如下技術方案:包括,MDSSD網絡利用先驗框機制對人臉區域檢測并對候選區域進行分類和框回歸;根據k-means對Ground Truth框進行聚類分析,尋找最佳的先驗框數量、大小和比例;所述MDSSD網絡將Focal loss代替分類網絡中的交叉熵損失函數,對聚類分析后的所述先驗框進行人臉和背景的檢測分類。
作為本發明所述的基于改進損失函數的MDSSD人臉檢測方法的一種優選方案,其中:所述MDSSD網絡包括,對深層特征圖或深層融合層進行0填充,結合3*3卷積對填充特征圖進行反卷積運算,在保證感受野范圍不變的條件下使所述特征圖的分辨率翻倍;利用與淺層特征圖通道維度相同的卷積核數量以保證所述反卷積運算輸出維度與所述淺層融合特征圖維度匹配;MDSSD特征融合時只對所述淺層特征圖與反卷積特征圖對應位置進行相加運算,以增強有效上下文信息;所述MDSSD通過在融合層添加激活層以進行非線性映射,并將激活后的所述融合層作為最終的檢測特征圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西科技大學,未經廣西科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011047720.5/2.html,轉載請聲明來源鉆瓜專利網。





