[發明專利]一種基于模型量化的MDSSD人臉檢測方法在審
| 申請號: | 202011181824.5 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112232270A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 王智文;安曉寧;王宇航 | 申請(專利權)人: | 廣西科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 南京禹為知識產權代理事務所(特殊普通合伙) 32272 | 代理人: | 朱寶慶 |
| 地址: | 545006 廣西壯族*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模型 量化 mdssd 檢測 方法 | ||
本發明公開了一種基于模型量化的MDSSD人臉檢測方法,包括,基于卷積神經網絡計算輸入圖像的積分圖并設置不同大小的特征模板提取所有樣本的特征;讀取所述所有樣本的特征值,選取損失最小的所述特征值作為第一個弱分類器的分類屬性;根據輕量化策略計算下一輪所述特征的權重值并計算所述弱分類器的權重;依次獲得多個弱分類器并組合成強分類器;將候選框內預選位置輸入所述強分類器內一一進行檢測,直至所有的所述弱分類器確認所述預選位置為人臉時結束分類。本發明通過對MDSSD人臉檢測模型進行量化壓縮建立MDSSD Lite輕量級模型,相對于SSD而言,其對小臉和模糊人臉召回率更高,同時保持了較快的檢測速度和檢測精度。
技術領域
本發明涉及人臉檢測的技術領域,尤其涉及一種基于模型量化的MDSSD人臉檢測方法。
背景技術
隨著深度學習的興起,與人臉相關的智能分析技術成為人工智能領域研究的重點和熱點,新的算法不斷刷新著人臉相關任務的評分,目前人臉識別技術已經超越人類的最高水平,同時與人臉相關的工業應用也是最廣泛的。例如與人臉檢測相關的應用有智能安防、城市大腦、安全駕駛以及中國的天網系統等;與人臉識別的相關應用包括人臉支付、智能門禁、人臉考勤、各種智能終端設備的人臉驗證等,人臉相關的技術與各種系統的安全息息相關。同時與人臉相關的技術也在不斷的應用到生活的方方面面,比如走失兒童尋找、智慧教育等。進一步隨著計算機計算能力的提高和5G網絡的應用,數據儲存的成本和數據傳輸的延時會越來越低,與人臉相關應用會部署到越來越多的智能終端上,真正實現智能社會而造福人類。人臉檢測即智能終端在輸入圖像上判斷是否有人臉存在,并找出人臉所在的位置。人臉檢測技術的前提就是能準確的檢測到人臉,而不受人臉圖像背景的影響。因此人臉檢測作為人臉相關任務的基礎和核心技術,受到研究人員的廣泛關注。
基于SSD算法的人臉檢測模型能快速準確的識別自然場景圖像中的人臉,同時該算法具有較高的檢測速度。但是SSD人臉檢測算法對自然或非自然場景下小臉檢測的召回率仍然有較大的提升空間,因此構建新的網絡MDSSD模型以及其量化模型MDSSD Lite,即Mix Deconvolution Single Shot MultiBox Detector用于人臉檢測;MDSSD算法對SSD算法在人臉檢測方面的諸多缺點進行改進,包括模型結構、檢測特征圖、參數配置、損失函數等,并通過機器學習方法對模型進行配置以減少人為經驗干預,大幅度提高了模型的檢測效果。
發明內容
本部分的目的在于概述本發明的實施例的一些方面以及簡要介紹一些較佳實施例。在本部分以及本申請的說明書摘要和發明名稱中可能會做些簡化或省略以避免使本部分、說明書摘要和發明名稱的目的模糊,而這種簡化或省略不能用于限制本發明的范圍。
鑒于上述現有存在的問題,提出了本發明。
因此,本發明提供了一種基于模型量化的MDSSD人臉檢測方法,能夠解決針對小臉檢測、模糊人臉召回率、檢測速度較低的問題。
為解決上述技術問題,本發明提供如下技術方案:包括,基于卷積神經網絡計算輸入圖像的積分圖并設置不同大小的特征模板提取所有樣本的特征;讀取所述所有樣本的特征值,選取損失最小的所述特征值作為第一個弱分類器的分類屬性;根據輕量化策略計算下一輪所述特征的權重值并計算所述弱分類器的權重;依次獲得多個弱分類器并組合成強分類器;將候選框內預選位置輸入所述強分類器內一一進行檢測,直至所有的所述弱分類器確認所述預選位置為人臉時結束分類。
作為本發明所述的基于模型量化的MDSSD人臉檢測方法的一種優選方案,其中:所述卷積神經網絡包括,卷積層、池化層和激活層;所述卷積層包括多個卷積核,利用所述卷積核在輸入圖像時進行固定步長滑動,掃描整個所述圖像并進行離散卷積計算,通過激活函數將卷積運算的輸出進行非線性映射,得到下一層網絡的輸入特征;所述池化層在卷積操作后對得到的特征圖像進行分塊,計算所述塊內的最大值或平均值得到池化后的圖像;所述激活層利用所述激活函數對上一層輸出進行非線性映射從而將非線性引入到網絡中,使得所述網絡捕捉更加復雜的非線性模式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西科技大學,未經廣西科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011181824.5/2.html,轉載請聲明來源鉆瓜專利網。





