[發(fā)明專利]一種表情的識別方法、裝置、設(shè)備及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202211692316.2 | 申請日: | 2022-12-28 |
| 公開(公告)號: | CN116189256A | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設(shè)計)人: | 戴彬;張文君;李林;林開標(biāo) | 申請(專利權(quán))人: | 廈門理工學(xué)院 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/82;G06V10/764;G06N3/045;G06N3/0464;G06N3/047 |
| 代理公司: | 廈門智慧呈睿知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35222 | 代理人: | 鄭擁軍 |
| 地址: | 361024 福*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 表情 識別 方法 裝置 設(shè)備 可讀 存儲 介質(zhì) | ||
本發(fā)明提供了一種表情的識別方法、裝置、設(shè)備及可讀存儲介質(zhì),包括:獲取待識別圖像,并將所述待識別圖像發(fā)送至訓(xùn)練好的雙鏈?zhǔn)骄W(wǎng)絡(luò)模型進(jìn)行特征提取;其中,所述雙鏈?zhǔn)骄W(wǎng)絡(luò)模型第一通道第n層能夠?qū)Φ谝煌ǖ赖?n?1)層和第二通道第(n?1)層的疊加特征進(jìn)行提取,其中,n>1;接收雙鏈?zhǔn)骄W(wǎng)絡(luò)模型第一通道最后一層輸出的表情特征,并基于softmax分類器對所述表情特征進(jìn)行分類,以完成表情識別,解決了用于識別表情的模型復(fù)雜度越來越高,導(dǎo)致邊緣端設(shè)備不好被部署的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)領(lǐng)域,特備涉及一種表情的識別方法、裝置、設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
現(xiàn)有的機(jī)器學(xué)習(xí)主要分為兩類:(1)基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法:SVM是統(tǒng)計學(xué)習(xí)中一種常用的分類方法,該方法具有特有的學(xué)習(xí)能力,可以有效地處理非線性、小樣本和高維數(shù)據(jù)等問題。缺點是在大樣本地情況下,矩陣計算需要耗費大量地時間和運行內(nèi)存,從而影響整體地識別效率。(2)基于深度學(xué)習(xí)的方法:CNN是一種端到端模式,通過卷積層、池化層以及全連接層、softmax等連接實現(xiàn)特征映射。CNN的缺點是當(dāng)網(wǎng)絡(luò)層數(shù)過深時候采用BP傳播修改參數(shù)會使靠近輸入層的參數(shù)改動較慢
在人臉表情識別一般采用機(jī)器學(xué)習(xí)的方式來進(jìn)行識別,然而目前深度學(xué)習(xí)的發(fā)展呈現(xiàn)網(wǎng)絡(luò)層次越來越深,網(wǎng)絡(luò)結(jié)構(gòu)越來越復(fù)雜的趨勢,為了追求更高的準(zhǔn)確率,網(wǎng)絡(luò)中會加入更多的參數(shù)導(dǎo)致模型的復(fù)雜度越來越高,所需計算力的提高導(dǎo)致,以使得邊緣端設(shè)備難以被部署,且還會產(chǎn)生因降溫設(shè)備導(dǎo)致的資源浪費。
有鑒于此,提出本申請。
發(fā)明內(nèi)容
本發(fā)明公開了一種表情的識別方法、裝置、設(shè)備及可讀存儲介質(zhì),旨在解決用于識別表情的模型復(fù)雜度越來越高,導(dǎo)致邊緣端設(shè)備不好被部署的問題。
本發(fā)明第一實施例提供了一種表情的識別方法,包括:
獲取待識別圖像,并將所述待識別圖像發(fā)送至訓(xùn)練好的雙鏈?zhǔn)骄W(wǎng)絡(luò)模型進(jìn)行特征提?。黄渲校鲭p鏈?zhǔn)骄W(wǎng)絡(luò)模型第一通道第n層能夠?qū)Φ谝煌ǖ赖?n-1)層和第二通道第(n-1)層的疊加特征進(jìn)行提取,其中,n>1;
接收雙鏈?zhǔn)骄W(wǎng)絡(luò)模型第一通道最后一層輸出的表情特征,并基于softmax分類器對所述表情特征進(jìn)行分類,以完成表情識別。
優(yōu)選地,所述獲取待識別圖像,并將所述待識別圖像發(fā)送至訓(xùn)練好的雙鏈?zhǔn)骄W(wǎng)絡(luò)模型進(jìn)行特征提取之前還包括:
將數(shù)據(jù)集按照預(yù)設(shè)比例劃分為訓(xùn)練集和測試集,其中,所述訓(xùn)練集和所述測試集中的每個表情標(biāo)注隨機(jī)排列且比例相同;
通過構(gòu)建好的雙鏈?zhǔn)骄W(wǎng)絡(luò)對所述訓(xùn)練集和測試集進(jìn)行加載,并獲取所述訓(xùn)練集和測試集的準(zhǔn)確率隨epochs的變化;
調(diào)整雙鏈?zhǔn)骄W(wǎng)絡(luò)每一層的參數(shù),直至識別準(zhǔn)確率到達(dá)預(yù)設(shè)值。
優(yōu)選地,所述數(shù)據(jù)集為增廣過的CK+數(shù)據(jù)集。
優(yōu)選地,所述雙鏈?zhǔn)骄W(wǎng)絡(luò)模型的兩側(cè)基于不同的卷積,以獲得通道數(shù)相同的特征值,通過特征疊加,生成從第一層到最后一層所獲得的不同粒度表情特征。
本發(fā)明第二實施例提供了一種表情的識別裝置,包括:
圖像獲取單元,用于獲取待識別圖像,并將所述待識別圖像發(fā)送至訓(xùn)練好的雙鏈?zhǔn)骄W(wǎng)絡(luò)模型進(jìn)行特征提?。黄渲?,所述雙鏈?zhǔn)骄W(wǎng)絡(luò)模型第一通道第n層能夠?qū)Φ谝煌ǖ赖?n-1)層和第二通道第(n-1)層的疊加特征進(jìn)行提取,其中,n>1;
表情識別單元,用于接收雙鏈?zhǔn)骄W(wǎng)絡(luò)模型第一通道最后一層輸出的表情特征,并基于softmax分類器對所述表情特征進(jìn)行分類,以完成表情識別。
優(yōu)選地,所述獲取待識別圖像,并將所述待識別圖像發(fā)送至訓(xùn)練好的雙鏈?zhǔn)骄W(wǎng)絡(luò)模型進(jìn)行特征提取之前還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門理工學(xué)院,未經(jīng)廈門理工學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211692316.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





