[發(fā)明專利]一種學(xué)習(xí)噪聲區(qū)域信息的人臉檢測(cè)方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110542099.8 | 申請(qǐng)日: | 2021-05-18 |
| 公開(公告)號(hào): | CN113128479B | 公開(公告)日: | 2023-04-18 |
| 發(fā)明(設(shè)計(jì))人: | 桑高麗;盧麗;閆超;胡二建 | 申請(qǐng)(專利權(quán))人: | 成都市威虎科技有限公司 |
| 主分類號(hào): | G06V40/16 | 分類號(hào): | G06V40/16;G06V10/30;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 鄭州宏海知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 41184 | 代理人: | 李曉 |
| 地址: | 610000 四川省成都市武侯區(qū)成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 學(xué)習(xí) 噪聲 區(qū)域 信息 檢測(cè) 方法 裝置 | ||
本發(fā)明涉及人臉檢測(cè)技術(shù)領(lǐng)域,具體涉及一種學(xué)習(xí)噪聲區(qū)域信息的人臉檢測(cè)方法及裝置,包括:搭建深度神經(jīng)網(wǎng)絡(luò)模型,提取訓(xùn)練樣本的特征圖,然后在特征圖上生成候選區(qū)域,并且每個(gè)候選區(qū)域需用預(yù)測(cè)定位信息和預(yù)測(cè)置信度定義無噪聲得分,然后針對(duì)每個(gè)候選區(qū)域用損失函數(shù)計(jì)算損失值,最后優(yōu)化損失值,得到優(yōu)化深度神經(jīng)網(wǎng)絡(luò)模型,輸入人臉圖像即可進(jìn)行人臉檢測(cè);其中,所述的候選區(qū)域由設(shè)定的錨框在每個(gè)特征點(diǎn)上生成。與現(xiàn)有技術(shù)相比,本發(fā)明通過將人臉檢測(cè)方法結(jié)合預(yù)測(cè)定位信息和預(yù)測(cè)置信度相結(jié)合計(jì)算得到無噪聲得分,并將得分作為候選區(qū)域的軟標(biāo)簽,再融入到損失函數(shù)中,使網(wǎng)絡(luò)模型在訓(xùn)練過程中學(xué)習(xí)到噪聲信息,有效地提高模型的魯棒性。
技術(shù)領(lǐng)域
本發(fā)明涉及人臉檢測(cè)領(lǐng)域,具體涉及一種學(xué)習(xí)噪聲區(qū)域信息的人臉檢測(cè)方法及裝置。
背景技術(shù)
近幾年,隨著深度學(xué)習(xí)和計(jì)算機(jī)算力的快速發(fā)展,目標(biāo)檢測(cè)技術(shù)領(lǐng)域的精度和速度也取得了很大的突破。人臉檢測(cè)技術(shù)是目標(biāo)檢測(cè)技術(shù)中較為重要的一個(gè)研究分支,主要做法是用剛性的邊界框包圍感興趣的目標(biāo),而且在過去的多年里得到了不斷地改進(jìn)完善。
人臉檢測(cè)技術(shù)通常用一組預(yù)先定義面積大小比例的候選框,即錨框,用于將類別判為目標(biāo)的位置回歸至期望的地方。人臉檢測(cè)技術(shù)的目的是完成定位和分類這兩個(gè)任務(wù),定位任務(wù)是使用真實(shí)邊界框作為“標(biāo)桿”訓(xùn)練預(yù)測(cè)位置,而分類任務(wù)是指導(dǎo)模型學(xué)習(xí)區(qū)分候選區(qū)域類別的能力,但是大量的候選區(qū)域中只有少量候選區(qū)域與真實(shí)邊界框有足夠地重疊,為了學(xué)習(xí)到更好的分類器,減弱樣本不平衡的影響,衍生出焦點(diǎn)損失函數(shù)和難例挖掘算法。除此之外,區(qū)別候選區(qū)域的類別標(biāo)簽是通過設(shè)定閾值判斷的,完全憑借經(jīng)驗(yàn)人為干預(yù),類別標(biāo)簽比較模糊,容易引入噪聲影響分類。例如,有時(shí)候候選區(qū)域?yàn)槟繕?biāo)的置信度較高,包含大量的語義信息,但因與真實(shí)邊界框重疊度比較低,按閾值判斷分為負(fù)樣本,這算一種噪聲信息,此外,由于矩形框的局限性,目標(biāo)之間的距離較小時(shí),有時(shí)候候選區(qū)域會(huì)包含多個(gè)目標(biāo),這就會(huì)引入另外一種噪聲信息。
綜上所述,生成候選區(qū)域的類別標(biāo)簽時(shí)總會(huì)引入不同形式的噪聲信息,因此,急需提出一種簡(jiǎn)單高效的人臉檢測(cè)方法,自適應(yīng)地生成候選區(qū)域的軟標(biāo)簽,充分利用噪聲區(qū)域的信息加強(qiáng)模型的性能。
發(fā)明內(nèi)容
針對(duì)上述問題,本發(fā)明的目的在于提供一種學(xué)習(xí)噪聲區(qū)域信息的人臉檢測(cè)方法及裝置,本發(fā)明采用的技術(shù)方案如下:
本發(fā)明的第一個(gè)目的是提供一種學(xué)習(xí)噪聲區(qū)域信息的人臉檢測(cè)方法,包括以下步驟:
S1、構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型,所述深度神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)結(jié)構(gòu)從前至后包括:卷積層、批歸一化層、激活函數(shù)層、第一混合深度可分離卷積模塊、最大值池化層、第一倒置殘差模塊、第二混合深度可分離卷積模塊、第二倒置殘差卷積模塊,所述第二倒置殘差卷積模塊后接兩個(gè)并行的卷積層;所述倒置殘差模塊從前至后由卷積層、批歸一化層、激活函數(shù)層、深度可分離卷積層、批歸一化層、激活函數(shù)層、卷積層、批歸一化層、特征相加層封裝而成;所述混合深度可分離卷積模塊從前至后由兩個(gè)并行的深度可分離卷積層、特征連接層、批歸一化層、激活函數(shù)層封裝而成;
S2、收集任意大小的人臉圖像,并預(yù)先定義錨框的長(zhǎng)寬比和面積大小比,然后分成訓(xùn)練集和測(cè)試集;
S3、將訓(xùn)練集輸入深度神經(jīng)網(wǎng)絡(luò)模型,由深度神經(jīng)網(wǎng)絡(luò)模型提取訓(xùn)練集中的人臉圖像特征圖,然后利用設(shè)定的錨框在人臉圖像特征圖的每個(gè)特征點(diǎn)上生成候選區(qū)域,并且每個(gè)候選區(qū)域用預(yù)測(cè)定位信息和預(yù)測(cè)置信度定義無噪聲得分;最后針對(duì)每個(gè)候選區(qū)域用損失函數(shù)計(jì)算損失值,并根據(jù)制定優(yōu)化策略衰減損失值,以及設(shè)定相關(guān)超參數(shù),重復(fù)對(duì)深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,直至損失值收斂,得到優(yōu)化深度神經(jīng)網(wǎng)絡(luò)模型。
S4、將人臉圖像輸入優(yōu)化深度神經(jīng)網(wǎng)絡(luò)模型,輸出人臉檢測(cè)結(jié)果。
進(jìn)一步地,所述無噪聲得分反映候選區(qū)域包含噪聲信息的程度;
所述無噪聲得分計(jì)算公式如下:
;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于成都市威虎科技有限公司,未經(jīng)成都市威虎科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110542099.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





