[發明專利]基于多尺度的級聯稠密連接神經網絡的人臉檢測方法有效
| 申請號: | 201810605067.6 | 申請日: | 2018-06-13 |
| 公開(公告)號: | CN108875624B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 秦華標;黃波 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06N3/04;G06N3/08 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 何淑珍;江裕強 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 尺度 級聯 稠密 連接 神經網絡 檢測 方法 | ||
本發明公開了基于多尺度的級聯稠密連接神經網絡的人臉檢測方法,屬于圖像處理和計算機視覺領域,適用于人臉識別、人臉表情識別、駕駛員疲勞檢測等智能系統。本發明包括區域提名網絡的構建方法和多級稠密連接卷積網絡模型的構建方法,具體包括:收集標注了人臉矩形框(bounding box)信息的人臉圖片,形成一個符合各個子網絡輸入條件的訓練數據集合;構造一個泛化能力強的級聯稠密連接神經網絡;利用訓練數據集合分別訓練各個子網絡,并得到整體網絡模型;最后利用該該整體網絡模型,檢測圖片中的多姿態人臉。本發明通過在網絡中引入了稠密連接的方式,使得網絡能夠充分提取人臉特征信息,從而提高多姿態下人臉檢測的準確率。
技術領域
本發明屬于圖像處理和計算機視覺領域,具體是一種基于多尺度的級聯稠密連接神經網絡的人臉檢測方法。
背景技術
人臉圖像中包含了豐富的信息,對人臉圖像的研究與分析是計算機視覺領域的重要方向和研究熱點。比如在人臉識別、人群監控、攝影、人機交互和疲勞駕駛等各種人工智能應用中,人臉檢測都是這些技術中關鍵的第一步,只有檢測到人臉,后面的分析與研究才會有價值。
近十幾年來,已有大量的學者對多姿態人臉檢測算法進行了深入的研究,總體來說,多姿態人臉檢測算法主要分為以下兩大類:基于傳統的機器學習方法和基于深度學習的方法。
傳統的機器學習算法一般是通過大量的樣本訓練得到分類器,以判別是人臉還是非人臉。在測試階段,最常用的方法是使用滑動窗口算法。首先,將輸入圖像縮放成各種不同的大小,建立圖像金字塔。然后對于金字塔中的每一層圖像的每個位置,取出一個固定大小的圖片,稱之為一個窗口。接著,在這個窗口中提取特征。最后,用訓練好的分類器去判斷這個窗口中是否是人臉。一般情況下,人臉檢測算法需要分類的窗口數量非常非常多,對于一個分辨率為640×480的圖片,一共大約有幾十萬個窗口,如何在短時間內準確的處理完這些窗口是每個人臉檢測算法需要考慮的問題。另外在特征提取過程中,傳統的機器學習算法提取的都是手工特征,例如:哈爾(Haar)特征,局部二值模式(Local Binary Pattern,LBP)特征,梯度直方圖(Histogram of Oriented Gradient,HOG)特征。這些手工特征因為加入了設計者的先驗知識,所以只能針對某些特定背景下的人臉有較高的準確率,難以應用于三維空間中多姿態人臉等復雜條件下?;谏疃葘W習的方法在目前的人臉檢測領域已經占據主導地位,主要的神經網絡架構包括卷積神經網絡(CNN)、深度置信網(DBN)、自動編碼器(Auto-encoder),其中在人臉檢測中運用最為成功的是卷積神經網絡。比如基于級聯的卷積神經網絡(Cascade CNNs)和基于多任務的卷積神經網絡(MTCNN),這些網絡采用卷積層自動提取穩定的人臉特征,檢測效果相對于傳統機器學習算法得到了很大提升。但是目前基于深度學習的人臉檢測模型往往是由數據驅動,用網絡來擬合訓練數據集,泛化性能較弱,在沒有多姿態訓練數據集參與訓練的條件下很難檢測到多姿態下的人臉。
因此,需要提出一種泛化性能更強的多姿態人臉檢測算法,在沒有多姿態人臉數據集參與訓練的情況下也能提高人臉檢測率。
發明內容
本發明的目的是解決人臉檢測易受到姿態變化影響的問題,提供基于多尺度的級聯稠密連接神經網絡的人臉檢測方法。本發明通過設計一個提取特征能力和泛化能力更強的級聯稠密連接網絡,然后利用收集并處理過的訓練數據集訓練該網絡模型,最后利用訓練完成的模型來檢測人臉,實現對多姿態下的人臉也能達到很好效果的算法。
本發明的至少通過如下技術方案之一實現。
基于多尺度的級聯稠密連接神經網絡的人臉檢測方法,該方法包括區域提名網絡的構建方法和多級稠密連接卷積網絡模型的構建方法:
區域提名網絡的構建方法為:在區域提名網絡的多個卷積層都進行可能包含人臉區域的得分預測和邊框的預測;然后淘汰得分小于設定閾值的區域塊,將剩下的區域塊進行非極大值抑制來得到最終的可能包含人臉的區域;最后將預測得到的人臉區域送進第二級的稠密連接卷積網絡;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810605067.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于圖像特征融合對比技術的人臉識別方法
- 下一篇:一種識別方法和電子設備





