[發(fā)明專利]基于深度學(xué)習(xí)的SSD的人臉檢測方法在審
| 申請?zhí)枺?/td> | 201611244868.1 | 申請日: | 2016-12-29 |
| 公開(公告)號: | CN108256400A | 公開(公告)日: | 2018-07-06 |
| 發(fā)明(設(shè)計)人: | 金海強(qiáng);朱毅;李漢曦;錢勝 | 申請(專利權(quán))人: | 上海玄彩美科網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200000 上海市浦東新區(qū)中國(上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人臉 人臉檢測 回歸 相對偏移量 輸入圖像 預(yù)測結(jié)果 多層級 置信度 送入 學(xué)習(xí) 網(wǎng)絡(luò) 圖片 | ||
1.一種基于深度學(xué)習(xí)的SSD的人臉檢測方法,其特征在于:所述方法包括以下步驟:(1)輸入圖像。(2)將得到的圖片resize成300×300,并送入網(wǎng)絡(luò)。(3)進(jìn)行多層級的提取feature map。(4)在每個feature map中各個位置location,每個location對應(yīng)多個default box。(5)對所有default box的特征分別回歸其類別的置信度和default box的相對偏移量。(6)對于每個default box,回歸出每個類別的class score。(7)根據(jù)回歸的類別中人臉類別的class score,選取default box。(8)根據(jù)default box的預(yù)測結(jié)果可以知道人臉的傾斜角度。從而知道人臉的朝向。
2.如權(quán)利要求1所述的基于深度學(xué)習(xí)的SSD的人臉檢測方法,其特征在于:所述步驟1)中,輸入的圖像分為正方形或長方形的矩形。若為正方形,則直接進(jìn)行步驟2);若為長方形,則從圖像中取多個正方形的子圖,并將每個子圖進(jìn)行步驟2)。
3.如權(quán)利要求1或2所述的基于深度學(xué)習(xí)的SSD的人臉檢測方法,其特征在于:所述步驟4)中,由于對于feature map中一個feature map cell一個位置上的 k 個boxes 中的每一個 box,我們需要計算出 c 個類,每一個類的 score,還有這個 box 相對于它的默認(rèn) box的 4 個偏移值(offsets),于是,在 feature map 中的每一個 feature map cell 上,就需要有 (c+4)×k 個 filters。對于一張 m×n 大小的 feature map,即會產(chǎn)生 (c+4)×k×m×n 個輸出結(jié)果(default box)。其中,每個feature map的default box的scale計算公式如下:其中,Smin和Smax分別表示最低層次和最高層次的scale,中間所有層次均勻分布,m表示feature map的個數(shù)。
4.如權(quán)利要求1或2所述的基于深度學(xué)習(xí)的SSD的人臉檢測方法,其特征在于:所述步驟5)中,default box的相對偏移量為一個10維的向量,分別是Δx,Δy,Δw,Δh,Δlt(x,y),Δlb(x,y),Δrb(x,y)。其中:Δx:default box中心點(diǎn)x坐標(biāo)的偏移量 Δy:default box中心的y坐標(biāo)的偏移量Δw:default box的寬度的偏移量Δh:default box的高度的偏移量Δlt(x,y):default box的中心點(diǎn)與左上角點(diǎn)之間的向量的改變量Δlb(x,y):default box的中心點(diǎn)與左下角點(diǎn)之間的向量的改變量Δrb(x,y):default box的中心點(diǎn)與右上角點(diǎn)之間的向量的改變量。
5.如權(quán)利要求1或2所述的基于深度學(xué)習(xí)的SSD的人臉檢測方法,其特征在于:所述步驟7)中,根據(jù)回歸的類別中人臉的類別的class score,去掉得分小于0.01的default box。根據(jù)剩下的各個default box的人臉類別的得分以及它們之間的overlapping 做NMS(NonMaximum Suppression,非極大值抑制),閾值為0.45。將最終的所剩下的default box按照人臉得分排序,取得分最高的200個default box。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海玄彩美科網(wǎng)絡(luò)科技有限公司,未經(jīng)上海玄彩美科網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611244868.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





