[發(fā)明專利]一種基于深度學(xué)習(xí)的實時人臉檢測方法在審
| 申請?zhí)枺?/td> | 201910654324.X | 申請日: | 2019-07-19 |
| 公開(公告)號: | CN110348423A | 公開(公告)日: | 2019-10-18 |
| 發(fā)明(設(shè)計)人: | 王雙琴;王凱東 | 申請(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 西安銘澤知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 61223 | 代理人: | 李振瑞 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 損失函數(shù) 人臉檢測 多層信息 基礎(chǔ)網(wǎng)絡(luò) 設(shè)計過程 網(wǎng)絡(luò)提取 訓(xùn)練過程 不均衡 交叉熵 置信度 融合 學(xué)習(xí) 引入 網(wǎng)絡(luò) | ||
本發(fā)明公開了一種基于深度學(xué)習(xí)的實時人臉檢測方法,采用MobileNets和SSD作為基礎(chǔ)網(wǎng)絡(luò),在此基礎(chǔ)上引入FPN將多層信息進行融合,使得網(wǎng)絡(luò)提取的特征更加豐富,對人臉檢測效果起到了積極的作用。另外在網(wǎng)絡(luò)損失函數(shù)的設(shè)計過程中,借鑒了MultiBox的損失函數(shù)形式,將整個損失函數(shù)劃分成置信度損失和定位損失兩個部分,并將MultiBox的2類交叉熵損失擴充為多類別Focal loss形式的損失函數(shù),很好的解決了在訓(xùn)練過程中出現(xiàn)的類別不均衡現(xiàn)象。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,特別是涉及一種基于深度學(xué)習(xí)的實時人臉檢測方法。
背景技術(shù)
人臉檢測中經(jīng)常使用目標檢測(object detection)算法,該算法只采用頂層特征做預(yù)測,但低層的特征語義信息比較少,但是目標位置準確;高層的特征語義信息比較豐富,但是目標位置比較粗略。另外雖然也有些算法采用多尺度特征融合的方式,但是一般是采用融合后的特征做預(yù)測,使得不同尺度下的特征語義信息豐富程度不盡人意。
而且對于分類問題,當各類別的訓(xùn)練數(shù)據(jù)不均衡時,模型訓(xùn)練會優(yōu)先數(shù)據(jù)比重較多的類別,對于較少數(shù)據(jù)的類別準確率可能較差,模型容易被帶偏。
發(fā)明內(nèi)容
本發(fā)明實施例提供了,可以解決現(xiàn)有技術(shù)中存在的問題。
本發(fā)明提供了一種基于深度學(xué)習(xí)的實時人臉檢測方法,包括以下步驟:
將SSD的基礎(chǔ)網(wǎng)絡(luò)VGG換成MobileNets,將待檢測圖像輸入至改進后的網(wǎng)絡(luò),將改進后的網(wǎng)絡(luò)中Conv11、Conv13、Conv14_2、Conv15_2、Conv16_2和Conv17_2這6層的特征圖分別進行兩兩特征融合后,再將融合后的結(jié)果與其他層的特征圖進行特征融合,直到所有層的特征圖融合完畢,每次融合后的特征圖以及Conv17_2中的特征圖均輸入到預(yù)測層中;
預(yù)測層對融合后的特征圖進行人臉檢測,輸出相應(yīng)的預(yù)測框,最后對這些預(yù)測框進行過濾,獲得最終的人臉檢測結(jié)果;
上述方法中損失函數(shù)分為置信度損失和定位損失兩部分,置信度損失采用Focalloss進行計算,定位損失采用Fast R-CNN中的Smooth L1 Loss進行計算。
本發(fā)明中的一種基于深度學(xué)習(xí)的實時人臉檢測方法,采用MobileNets+SSD作為基礎(chǔ)網(wǎng)絡(luò),在此基礎(chǔ)上引入FPN將多層信息進行融合,使得網(wǎng)絡(luò)提取的特征更加豐富,對人臉檢測效果起到了積極的作用。另外在網(wǎng)絡(luò)損失函數(shù)的設(shè)計過程中,借鑒了MultiBox的損失函數(shù)形式,將整個損失函數(shù)劃分成置信度損失和定位損失兩個部分,并將MultiBox的2類交叉熵損失擴充為多類別Focal loss形式的損失函數(shù),很好的解決了在訓(xùn)練過程中出現(xiàn)的類別不均衡現(xiàn)象。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為特征融合過程的示意圖;
圖2為特征融合模塊的處理過程示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910654324.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種基于多目標學(xué)習(xí)的人臉識別算法訓(xùn)練方法
- 用于重識別的損失函數(shù)確定的方法及裝置
- 一種構(gòu)造逆標簽及其損失函數(shù)的方法
- 一種平衡多個任務(wù)的方法及系統(tǒng)
- 圖像生成模型的訓(xùn)練方法、圖像生成方法及裝置
- 基于注釋信息的分類
- 經(jīng)由對偶分解評估損失函數(shù)或損失函數(shù)的梯度的系統(tǒng)和方法
- 分類模型的訓(xùn)練方法、裝置、電子設(shè)備以及存儲介質(zhì)
- 一種基于幾何位置關(guān)系損失函數(shù)的虹膜分割方法
- 一種基于多任務(wù)損失函數(shù)的目標檢測方法及系統(tǒng)
- 網(wǎng)絡(luò)服務(wù)中介器系統(tǒng)和方法
- 多制式網(wǎng)絡(luò)下的通信方法、網(wǎng)絡(luò)設(shè)備及通信系統(tǒng)
- 網(wǎng)絡(luò)基礎(chǔ)設(shè)施部件、具有多個網(wǎng)絡(luò)基礎(chǔ)設(shè)施部件的復(fù)合系統(tǒng)和該復(fù)合系統(tǒng)的使用
- 一種測量網(wǎng)絡(luò)時延的方法和設(shè)備
- 用于基礎(chǔ)設(shè)施的網(wǎng)絡(luò)部署的方法、系統(tǒng)以及計算機可讀介質(zhì)
- 一種通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施的評價方法和裝置
- 虛擬基礎(chǔ)架構(gòu)資源的層次化管理裝置及方法
- 面向網(wǎng)絡(luò)多域信息的用戶角色挖掘系統(tǒng)
- 網(wǎng)絡(luò)中設(shè)備基礎(chǔ)信息收集方法、網(wǎng)絡(luò)邊緣設(shè)備及網(wǎng)絡(luò)設(shè)備
- 一種關(guān)鍵基礎(chǔ)設(shè)施網(wǎng)絡(luò)彈性強化方法及系統(tǒng)





