[發(fā)明專利]基于GAN擴(kuò)充多人種特征協(xié)同選擇的人臉年齡估計(jì)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811195416.8 | 申請(qǐng)日: | 2018-10-15 |
| 公開(公告)號(hào): | CN109299701B | 公開(公告)日: | 2021-12-14 |
| 發(fā)明(設(shè)計(jì))人: | 田青;沈傳奇;毛軍翔;孫元康;秦璇;黃媛沅 | 申請(qǐng)(專利權(quán))人: | 南京信息工程大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 戴朝榮 |
| 地址: | 210044 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 gan 擴(kuò)充 人種 特征 協(xié)同 選擇 年齡 估計(jì) 方法 | ||
本發(fā)明公開了一種基于GAN擴(kuò)充多人種特征協(xié)同選擇的人臉年齡估計(jì)方法,先通過生成式對(duì)抗網(wǎng)絡(luò)進(jìn)行多風(fēng)格人臉樣本的模擬生成,來快速地大規(guī)模地?cái)U(kuò)充不同人種的人臉庫,從而提高對(duì)黃色、棕色等人種年齡信息識(shí)別的精度。然后利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)原有數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,接著基于擴(kuò)充得到的人臉年齡數(shù)據(jù)庫進(jìn)行進(jìn)一步的精訓(xùn)練。最后將四個(gè)人種的Sub?CNN進(jìn)行基于組稀疏算法的聯(lián)合特征選擇融合,以此來解決基于人臉圖像的年齡估計(jì)問題。本發(fā)明得到了更具泛化能力的人臉年齡估計(jì)模型,同時(shí)也能大大提高很多年齡人臉識(shí)別系統(tǒng)的性能,彌補(bǔ)了以往研究的不足之處。
技術(shù)領(lǐng)域
本發(fā)明涉及一種人臉年齡估計(jì)方法,特別是一種基于GAN擴(kuò)充多人種特征協(xié)同選擇的人臉年齡估計(jì)方法。
背景技術(shù)
隨著人機(jī)交互的相關(guān)理論與應(yīng)用研究的快速發(fā)展,年齡信息作為人類的一種重要生物特征,在此領(lǐng)域中有著眾多應(yīng)用需求,并且對(duì)人臉識(shí)別系統(tǒng)的性能有著重要影響。但是絕大部分的研究是基于現(xiàn)有的數(shù)據(jù)集,由于在很多國外的現(xiàn)有大型數(shù)據(jù)集上黃色、棕色等人種樣本過少,大大限制了對(duì)黃色、棕色等人種圖片的年齡辨識(shí)。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種基于GAN擴(kuò)充多人種特征協(xié)同選擇的人臉年齡估計(jì)方法,得到更具泛化能力的人臉年齡估計(jì)模型。
為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:
一種基于GAN擴(kuò)充多人種特征協(xié)同選擇的人臉年齡估計(jì)方法,其特征在于包含以下步驟:
步驟一:通過網(wǎng)絡(luò)爬蟲從Internet網(wǎng)上下載所缺人臉圖像集;
步驟二:基于步驟一的人臉圖像集進(jìn)行GAN人臉多風(fēng)格樣本輸出模型的訓(xùn)練,擴(kuò)充完善現(xiàn)有人臉年齡數(shù)據(jù)庫;
步驟三:在完成基于GAN對(duì)人臉年齡數(shù)據(jù)庫模擬生成多風(fēng)格不同人種人臉年齡圖片后,針對(duì)每一組人種數(shù)據(jù)集設(shè)計(jì)一個(gè)CNN模型,總共設(shè)計(jì)四個(gè)串聯(lián)形式的Sub-CNN,并借助LFW、CACD大型人臉庫對(duì)Sub-CNN模型進(jìn)行預(yù)訓(xùn)練,然后對(duì)其基于擴(kuò)充得到的人臉年齡數(shù)據(jù)庫進(jìn)行進(jìn)一步的精訓(xùn)練;
步驟四:基于組稀疏Group-lasso的聯(lián)合特征選擇,應(yīng)用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練權(quán)值向量的過程中;
步驟五:多人種年齡識(shí)別模型建立完成,通過模型進(jìn)行人臉年齡估計(jì)。
進(jìn)一步地,所述步驟二生成式對(duì)抗網(wǎng)絡(luò)為
生成式對(duì)抗網(wǎng)絡(luò)由生成模型Generative Model和判別模型DiscriminativeModel兩個(gè)模塊構(gòu)成,生成模型G的目標(biāo)是使其生成的偽數(shù)據(jù)G(z)在判別模型D上的表現(xiàn)和真實(shí)數(shù)據(jù)x在D上的表現(xiàn)一致,G和D互相博弈學(xué)習(xí)并迭代優(yōu)化的過程使得它們的性能不斷提升,隨著D的判別能力提升,并且無法判別其數(shù)據(jù)來源時(shí),則認(rèn)為G已學(xué)到真實(shí)的數(shù)據(jù)分布,根據(jù)生成式對(duì)抗網(wǎng)絡(luò)的特性,對(duì)通過網(wǎng)絡(luò)爬蟲從網(wǎng)上下載的所缺人臉圖像集,進(jìn)行快速擴(kuò)充類似的且多風(fēng)格的樣本。
進(jìn)一步地,所述生成模型的作用是盡可能地學(xué)習(xí)真實(shí)的數(shù)據(jù)分布,輸入隨機(jī)變量z,則G盡可能地生成服從真實(shí)數(shù)據(jù)分布的樣本G(z);判別模型的作用是判別其輸入數(shù)據(jù)是來自生成模型G還是來自真實(shí)的數(shù)據(jù)x,如果輸入來自G(z),則標(biāo)注為0并判別為偽,否則標(biāo)注為1并判別為真。
進(jìn)一步地,所述步驟三具體為世界人種可分為棕色、黃色、黑色、白色,不同人種間的人面部特征由于氣候條件、地理位置、傳統(tǒng)風(fēng)俗、遺傳因子等因素的影響存在顯著的差異性,而在相同人種間這種差異性在某種程度上相對(duì)較小,在完成基于GAN對(duì)人臉年齡數(shù)據(jù)庫模擬生成多風(fēng)格不同人種人臉年齡圖片后,針對(duì)每一組人種數(shù)據(jù)集,設(shè)計(jì)一個(gè)CNN模型,即總共設(shè)計(jì)四個(gè)串聯(lián)形式的Sub-CNN,并借助LFW、CACD等大型人臉庫對(duì)Sub-CNN模型進(jìn)行預(yù)訓(xùn)練,然后對(duì)其基于擴(kuò)充得到的人臉年齡數(shù)據(jù)庫進(jìn)行進(jìn)一步的精訓(xùn)練。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京信息工程大學(xué),未經(jīng)南京信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811195416.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





