[發明專利]一種基于聚類分析與模型壓縮的人臉檢測方法在審
| 申請號: | 202010992907.6 | 申請日: | 2020-09-21 |
| 公開(公告)號: | CN112132005A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 柯逍;黃旭;蔣培龍 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 錢莉;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聚類分析 模型 壓縮 檢測 方法 | ||
本發明涉及一種基于聚類分析與模型壓縮的人臉檢測方法,首先獲取人臉檢測數據集,對人臉數據集進行K?means聚類分析,進行錨框數量、大小與數據集適用程度分析,最終生成最適合該數據集的檢測錨框;接著將生成的檢測錨框應用于深度學習網絡中,訓練人臉檢測網絡;最后對訓練好的人臉檢測網絡,進行層剪枝或者通道剪枝后,對網絡進行微調,得到更加輕量級的網絡;利用該網絡對圖像、視頻進行檢測,得到最終的結果。本發明具有檢測準確率高與檢測速率快并存的優點,能應用于人臉考勤、門禁系統、交通身份核準等場景。
技術領域
本發明涉及人臉檢測與計算機視覺領域,特別是一種基于聚類分析與模型壓縮的人臉檢測方法。
背景技術
隨著科學技術的不斷發展進步,作為其中重要部分的信息技術也有著長足的發展,大量的數據隨之而生,隨著數據誕生的計算機視覺技術在人們的生活中也發揮著越來越重要的作用。在今天,人臉檢測這一技術被應用在各種各樣的方面,例如:考勤、門禁、甚至是監控下的對于特定人群的尋找等等。但現在許多深度學習網絡進行的人臉檢測存在實時性效果不足的問題。
發明內容
有鑒于此,針對現在許多深度學習網絡進行的人臉檢測實時性效果不足的問題,本發明的目的是提供一種基于聚類分析與模型壓縮的人臉檢測方法,通過聚類將更符合人臉大小、數量的錨框應用于原深度學習網絡中,提高精度。模型壓縮方法,在盡可能保持精度的前提下,將深度學習網絡模型進行寬度與深度的壓縮,使得檢測速度更快,更加符合實時性要求。
本發明采用以下方案實現:一種基于聚類分析與模型壓縮的人臉檢測方法,包括以下步驟:
步驟S1:獲取公開的人臉檢測數據集,對人臉數據集進行K-means聚類分析,生成適用于該數據的錨框,包括錨框的數量與大??;
步驟S2:使用步驟S1獲取的數據集,以YOLOv3深度學習網絡為基礎,并將步驟S1生成的錨框應用于其中,進行人臉檢測網絡的訓練;
步驟S3:對步驟S2中訓練好的人臉檢測網絡進行層剪枝或通道剪枝或同時進行層剪枝與通道剪枝,對剪枝后的網絡進行微調;
步驟S4:使用步驟S3中剪枝完成的網絡,進行圖片檢測或者視頻檢測,得到最終的人臉檢測結果。
進一步地,所述步驟S1具體包括以下步驟:
步驟S11:采用公開的人臉檢測數據集,標簽信息不完整或與標注信息不一致無用數據采用遍歷數據集的方式進行剔除,以此完成數據預處理,并將其中70%劃分為訓練集,30%劃分為測試集;
步驟S12:將將公開人臉檢測數據集中的訓練集的每張圖像的每一個像素點歸一化到0-1的值,最終將圖像轉化為每個矩陣點值在0-1范圍內的歸一化矩陣,根據每個圖像的歸一化矩陣,計算每個圖像之間的歐幾里得范數距離,最終根據距離確定此人臉數據集應用K-means方法得到的K值范圍,K值取3到12;
步驟S13:根據K值在訓練集樣本中隨機選取G張圖片,G與K數值上相等,G張圖片作為初始的聚類中心接著計算每張圖像與各個選取出來聚類中心之間的距離,把每張圖片分配給離它距離最近的聚類中心,其中K-means聚類分析的目標函數如下:
上式中:L為目標函數,Object為樣本目標,Center為類簇的中心;nv為v個聚類中心的樣本個數;Q為本目標的總個數;IIoU(Object,Center)為聚類算法流程中的中心框與聚類框的交并比;a為樣本中心序號,其序號從1開始到原先選取的K值;b為類簇的中心序號;
步驟S14:每次分配一個圖片樣本,聚類中心根據每個類簇中現有的對象進行重新計算;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010992907.6/2.html,轉載請聲明來源鉆瓜專利網。





