[發(fā)明專利]基于雙向長短期記憶網(wǎng)絡(luò)的人臉屬性識別方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810921302.0 | 申請日: | 2018-08-14 |
| 公開(公告)號: | CN109190514B | 公開(公告)日: | 2021-10-01 |
| 發(fā)明(設(shè)計)人: | 程建;劉三元;蘇炎洲;劉濟樾;李燦 | 申請(專利權(quán))人: | 電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 成都弘毅天承知識產(chǎn)權(quán)代理有限公司 51230 | 代理人: | 鄒敏菲 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 雙向 短期 記憶 網(wǎng)絡(luò) 屬性 識別 方法 系統(tǒng) | ||
1.一種基于雙向長短期記憶網(wǎng)絡(luò)的人臉屬性識別方法,其特征在于,包括:
S1、獲取人臉圖像數(shù)據(jù)集;
S2、將獲取的人臉圖像數(shù)據(jù)集進行圖像預(yù)處理后,生成人臉圖像訓練集;
S3、構(gòu)建基于雙向長短期記憶網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò),將人臉圖像訓練集作為輸入對所述深度神經(jīng)網(wǎng)絡(luò)進行訓練,得到深度神經(jīng)網(wǎng)絡(luò)模型,具體包括:
(1)構(gòu)建前段卷積神經(jīng)網(wǎng)絡(luò);
(2)構(gòu)建后段雙向長短期記憶網(wǎng)絡(luò),所述后段雙向長短期記憶網(wǎng)絡(luò)的損失函數(shù)為:
其中aj代表第j個任務(wù)所對應(yīng)的損失,lavg代表所有任務(wù)的平均損失,lmax和lmin代表所有任務(wù)中損失的最大項和最小項;
(3)前段卷積神經(jīng)網(wǎng)絡(luò)分別與后段雙向長短期記憶網(wǎng)絡(luò)連接,然后再在雙向長短期記憶網(wǎng)絡(luò)后依次連接一個全連接層和reshape層,從而構(gòu)成基于雙向長短期記憶網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò);
S4、將待識別的測試圖像輸入至訓練好的深度神經(jīng)網(wǎng)絡(luò)模型進行人臉屬性識別。
2.如權(quán)利要求1所述的基于雙向長短期記憶網(wǎng)絡(luò)的人臉屬性識別方法,其特征在于,所述后段雙向長短期記憶網(wǎng)絡(luò),包括:
正向長短期記憶網(wǎng)絡(luò),用于對前段卷積神經(jīng)網(wǎng)絡(luò)得到的人臉屬性特征進行從前向后的方向進行掃描,從而得到正向序列;
反向長短期記憶網(wǎng)絡(luò),用于對前段卷積神經(jīng)網(wǎng)絡(luò)得到的人臉屬性特征進行從后向前的方向進行掃描,從而得到反向序列。
3.如權(quán)利要求1所述的基于雙向長短期記憶網(wǎng)絡(luò)的人臉屬性識別方法,其特征在于,步驟S4中進行人臉屬性識別的具體步驟包括:
(1)將經(jīng)過步驟S2的圖像預(yù)處理后的測試圖像,輸入前段卷積神經(jīng)網(wǎng)絡(luò),提取人臉屬性特征;
(2)通過雙向長短期記憶網(wǎng)絡(luò)后得到人臉屬性特征的正向序列和反向序列;
(3)將人臉屬性特征的正向序列和反向序列輸出至最后一個全連接層進行合并,從而輸出一個80維的人臉屬性特征;
(4)然后利用reshape層將人臉屬性特征的80維變?yōu)?乘40,表示人臉對應(yīng)的40個人臉屬性特征的判斷結(jié)果。
4.一種基于雙向長短期記憶網(wǎng)絡(luò)的人臉屬性識別系統(tǒng),其特征在于,包括:
圖像采集單元(101),用于獲取人臉圖像數(shù)據(jù)集;
圖像處理單元(102),用于將獲取的人臉圖像數(shù)據(jù)集進行圖像預(yù)處理后,生成人臉圖像訓練集;
神經(jīng)網(wǎng)絡(luò)訓練單元(103),用于構(gòu)建基于雙向長短期記憶網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò),將人臉圖像訓練集作為輸入對所述深度神經(jīng)網(wǎng)絡(luò)進行訓練,得到深度神經(jīng)網(wǎng)絡(luò)模型,具體包括:
(1)構(gòu)建前段卷積神經(jīng)網(wǎng)絡(luò);
(2)構(gòu)建后段雙向長短期記憶網(wǎng)絡(luò),所述后段雙向長短期記憶網(wǎng)絡(luò)的損失函數(shù)為:
其中aj代表第j個任務(wù)所對應(yīng)的損失,lavg代表所有任務(wù)的平均損失,lmax和lmin代表所有任務(wù)中損失的最大項和最小項;
(3)前段卷積神經(jīng)網(wǎng)絡(luò)分別與后段雙向長短期記憶網(wǎng)絡(luò)連接,然后再在雙向長短期記憶網(wǎng)絡(luò)后依次連接一個全連接層和reshape層,從而構(gòu)成基于雙向長短期記憶網(wǎng)絡(luò)的深度神經(jīng)網(wǎng)絡(luò);
人臉屬性識別單元(104),用于將待識別的測試圖像輸入至訓練好的深度神經(jīng)網(wǎng)絡(luò)模型進行人臉屬性識別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學,未經(jīng)電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810921302.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





