[發(fā)明專利]基于深度學(xué)習(xí)的人臉表情識別方法及裝置在審
| 申請?zhí)枺?/td> | 201711067390.4 | 申請日: | 2017-11-02 |
| 公開(公告)號: | CN107729872A | 公開(公告)日: | 2018-02-23 |
| 發(fā)明(設(shè)計)人: | 鄒建成;宋瑞 | 申請(專利權(quán))人: | 北方工業(yè)大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京北新智誠知識產(chǎn)權(quán)代理有限公司11100 | 代理人: | 朱麗華 |
| 地址: | 100043 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 學(xué)習(xí) 表情 識別 方法 裝置 | ||
1.基于深度學(xué)習(xí)的人臉表情識別裝置,其特征在于,包括人臉識別模塊、預(yù)處理模塊、人臉表情識別模塊,
人臉識別模塊,用于從輸入圖像中識別出人臉區(qū)域圖像;
預(yù)處理模塊,用于對人臉區(qū)域圖像進(jìn)行預(yù)處理,將人臉區(qū)域圖像調(diào)整為正面人臉姿態(tài)的人臉區(qū)域圖像;
人臉表情識別模塊,用于將預(yù)處理后的人臉區(qū)域圖像輸入卷積神經(jīng)網(wǎng)絡(luò)模型,輸出人臉表情識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的人臉表情識別裝置,其特征在于,將所述預(yù)處理后的人臉區(qū)域圖像裁剪為大小為227*227的特征圖,輸入所述卷積神經(jīng)網(wǎng)絡(luò)模型;
所述卷積神經(jīng)網(wǎng)絡(luò)模型包括依序連接的2個卷積層、1個池化層、2個卷積層、1個池化層和2個全連接層;
1)卷積層I,卷積核大小為11*11,步長為4,卷積核個數(shù)為96,無填充;
2)卷積層II,卷積核大小為3*3,步長為2,卷積核個數(shù)為128,填充為2:
3)池化層I,卷積核大小為3*3,步長為2,無填充;
4)卷積層III,卷積核大小為3*3,步長為1,卷積核個數(shù)為256,無填充;
5)卷積層IV,卷積核大小為2*2,步長為2,卷積核個數(shù)為256,無填充;
6)池化層II,卷積核大小為2*2,步長為2,無填充;
7)全連接層I,將池化層II輸出的特征圖轉(zhuǎn)換為一維特征向量;
8)全連接層II,對全連接層I中的神經(jīng)元進(jìn)行全鏈接,得到7個預(yù)測值,輸入到Softmax分類器。
3.根據(jù)權(quán)利要求2所述的基于深度學(xué)習(xí)的人臉表情識別裝置,其特征在于,所述人臉識別模塊利用harr特征檢測算法、adaboost分類算法識別出所述人臉區(qū)域圖像。
4.根據(jù)權(quán)利要求2所述的基于深度學(xué)習(xí)的人臉表情識別裝置,其特征在于,所述預(yù)處理模塊將具有一定程度的姿態(tài)變化的人臉區(qū)域圖像利用仿射變換方法矯正為相似的正面人臉姿態(tài)的人臉區(qū)域圖像。
5.基于深度學(xué)習(xí)的人臉表情識別方法,其特征在于,包括:
識別人臉區(qū)域圖像;
將人臉區(qū)域圖像調(diào)整為正面人臉姿態(tài)的人臉區(qū)域圖像;
將調(diào)整后的人臉區(qū)域圖像輸入卷積神經(jīng)網(wǎng)絡(luò)模型,輸出人臉表情識別結(jié)果。
6.根據(jù)權(quán)利要求5所述的基于深度學(xué)習(xí)的人臉表情識別方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)模型包括依序連接的2個卷積層、1個池化層、2個卷積層、1個池化層和2個全連接層;
1)卷積層I,卷積核大小為11*11,步長為4,卷積核個數(shù)為96,無填充;
2)卷積層II,卷積核大小為3*3,步長為2,卷積核個數(shù)為128,填充為2:
3)池化層I,卷積核大小為3*3,步長為2,無填充;
4)卷積層III,卷積核大小為3*3,步長為1,卷積核個數(shù)為256,無填充;
5)卷積層IV,卷積核大小為2*2,步長為2,卷積核個數(shù)為256,無填充;
6)池化層II,卷積核大小為2*2,步長為2,無填充;
7)全連接層I,將池化層II輸出的特征圖轉(zhuǎn)換為一維特征向量;
8)全連接層II,對全連接層I中的神經(jīng)元進(jìn)行全鏈接,得到7個預(yù)測值,輸入到Softmax分類器。
7.根據(jù)權(quán)利要求6所述的基于深度學(xué)習(xí)的人臉表情識別方法,其特征在于,利用harr特征檢測算法、adaboost分類算法識別所述人臉區(qū)域圖像。
8.根據(jù)權(quán)利要求6所述的基于深度學(xué)習(xí)的人臉表情識別方法,其特征在于,將具有一定程度的姿態(tài)變化的人臉區(qū)域圖像利用仿射變換方法調(diào)整為相似的正面人臉姿態(tài)的人臉區(qū)域圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北方工業(yè)大學(xué),未經(jīng)北方工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711067390.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





