[發(fā)明專利]一種改進(jìn)的FasterR?CNN人臉檢測方法在審
| 申請?zhí)枺?/td> | 201710714095.7 | 申請日: | 2017-08-18 |
| 公開(公告)號: | CN107527029A | 公開(公告)日: | 2017-12-29 |
| 發(fā)明(設(shè)計)人: | 衛(wèi)晨;李偉山 | 申請(專利權(quán))人: | 衛(wèi)晨 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 陜西增瑞律師事務(wù)所61219 | 代理人: | 劉艷霞 |
| 地址: | 710021 陜西省西安市未*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 改進(jìn) fasterr cnn 檢測 方法 | ||
1.一種改進(jìn)的Faster R-CNN人臉檢測方法,其特征在于,包括以下步驟:
步驟1、將原始圖片輸入到RPN網(wǎng)絡(luò)中,輸出多尺度的候選區(qū)域定位框和定位框內(nèi)包含人臉的概率值;
步驟2、用非極大值抑制算法處理步驟1中的區(qū)域定位框,依據(jù)概率值,由高到低依次選取300個候選的人臉區(qū)域定位框;
步驟3、將步驟1中的初始圖片和步驟2中的300個候選的人臉區(qū)域定位框輸入到目標(biāo)檢測網(wǎng)絡(luò)中;
步驟4:目標(biāo)檢測網(wǎng)絡(luò)對輸入的圖片進(jìn)行卷積運(yùn)算,并經(jīng)過多層卷積層前向傳播到最后一層卷積層,輸出圖片特征圖;
步驟5、將步驟2中的300個候選的人臉區(qū)域定位框通過坐標(biāo)的映射變換,映射到步驟4中的圖片特征圖上,即得到300個候選的人臉區(qū)域定位框的特征圖;
步驟6、將步驟5中的300個候選的人臉區(qū)域定位框的特征圖依次經(jīng)ROI pooling層,得尺寸相一致的300個候選的人臉區(qū)域定位框的特征圖;
步驟7、將步驟6中的尺寸相一致的300個候選的人臉區(qū)域定位框的特征圖進(jìn)行分類,輸出人臉區(qū)域坐標(biāo)和概率。
2.根據(jù)權(quán)利要求1所述的一種改進(jìn)的Faster R-CNN人臉檢測方法,其特征在于,所述步驟1中,候選區(qū)域定位框為12種不同規(guī)格大小。
3.根據(jù)權(quán)利要求1或2所述的一種改進(jìn)的Faster R-CNN人臉檢測方法,其特征在于,所述步驟3中的目標(biāo)檢測網(wǎng)絡(luò)包括依次排列的特征提取層、ROI pooling層、全連接層、分類器和定位框回歸器;所述特征提取層包括依次連接的多層卷積層。
4.根據(jù)權(quán)利要求3所述的一種改進(jìn)的Faster R-CNN人臉檢測方法,其特征在于,特征提取層選用101層的殘差網(wǎng)絡(luò)。
5.根據(jù)權(quán)利要求4所述的一種改進(jìn)的Faster R-CNN人臉檢測方法,其特征在于,所述101層的殘差網(wǎng)絡(luò)中,第四個殘差塊conv5_x中的每一個殘差單元中間層為擴(kuò)張卷積層,其擴(kuò)張系數(shù)為2。
6.根據(jù)權(quán)利要求4~5中任一項所述的一種改進(jìn)的Faster R-CNN人臉檢測方法,其特征在于,所述RPN網(wǎng)絡(luò)和目標(biāo)檢測網(wǎng)絡(luò)共用特征提取層。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于衛(wèi)晨,未經(jīng)衛(wèi)晨許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710714095.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種基于深度學(xué)習(xí)的焊縫超聲TOFD?D掃描缺陷類型的自動識別方法
- 一種改進(jìn)的FasterR?CNN人臉檢測方法
- 一種三維模型部件的自動檢測方法
- 一種基于深度神經(jīng)網(wǎng)絡(luò)的直腸癌環(huán)周切緣MRI圖像自動識別方法及系統(tǒng)
- 一種基于多模態(tài)關(guān)系的網(wǎng)絡(luò)謠言檢測方法
- 一種多特征提取網(wǎng)絡(luò)的目標(biāo)檢測方法
- 基于改進(jìn)FasterR-CNN的復(fù)雜戰(zhàn)場環(huán)境目標(biāo)高效識別方法
- 一種基于改進(jìn)FasterR-CNN的海底生物目標(biāo)檢測方法
- 用于PCB電路板的檢測系統(tǒng)
- 一種基于BiRNN的行駛的非機(jī)動車匹配方法
- 圖像語義標(biāo)注的設(shè)備和方法及其模型的生成方法和系統(tǒng)
- 使用卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像處理
- 為數(shù)據(jù)庫確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 采用嵌入式系統(tǒng)中的小規(guī)模卷積神經(jīng)網(wǎng)絡(luò)模塊的人臉檢測
- 針對深度通道和卷積神經(jīng)網(wǎng)絡(luò)圖像和格式使用相機(jī)設(shè)備的方法和系統(tǒng)
- 處理卷積神經(jīng)網(wǎng)絡(luò)的方法
- CNN加速器和電子設(shè)備
- 一種基于混合神經(jīng)網(wǎng)絡(luò)的腦電時空特征學(xué)習(xí)與情感分類方法
- 一種基于FPGA的深度學(xué)習(xí)加速方法





