[發(fā)明專利]一種基于自注意力的卒中患者表情識(shí)別方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202210087537.0 | 申請(qǐng)日: | 2022-01-25 |
| 公開(kāi)(公告)號(hào): | CN114429659A | 公開(kāi)(公告)日: | 2022-05-03 |
| 發(fā)明(設(shè)計(jì))人: | 朱嘯宇;陸小鋒;曾鳳珍;宋海洋;朱民耀;王鶴瑋;賈杰 | 申請(qǐng)(專利權(quán))人: | 上海大學(xué) |
| 主分類號(hào): | G06V40/16 | 分類號(hào): | G06V40/16;G06K9/62;G06N3/04;G06N3/08;G06V10/774;G06V10/82 |
| 代理公司: | 北京高沃律師事務(wù)所 11569 | 代理人: | 趙興華 |
| 地址: | 200444*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 注意力 患者 表情 識(shí)別 方法 系統(tǒng) | ||
1.一種基于自注意力的卒中患者表情識(shí)別方法,其特征在于,所述方法包括:
獲取卒中患者表情數(shù)據(jù)集;
構(gòu)建基于ViT的表情識(shí)別模型;
通過(guò)人臉表情數(shù)據(jù)集和所述卒中患者表情數(shù)據(jù)集對(duì)所述基于ViT的表情識(shí)別模型進(jìn)行訓(xùn)練;
通過(guò)訓(xùn)練好的基于ViT的表情識(shí)別模型識(shí)別卒中患者表情的類別。
2.根據(jù)權(quán)利要求1所述的基于自注意力的卒中患者表情識(shí)別方法,其特征在于,所述獲取卒中患者表情數(shù)據(jù)集,具體包括:
獲取卒中患者的表情視頻;
對(duì)所述表情視頻進(jìn)行標(biāo)注,得到各類表情的分段視頻;
將各所述分段視頻進(jìn)行圖片化處理,得到各類表情的圖片組;所述圖片組中的圖片包括表情起始狀態(tài)、表情結(jié)束狀態(tài)和表情峰值狀態(tài);
框出所述各類表情的圖片組中的人臉,得到臉部圖片;
將所述臉部圖片進(jìn)行縮放,得到所述卒中患者表情數(shù)據(jù)集。
3.根據(jù)權(quán)利要求1所述的基于自注意力的卒中患者表情識(shí)別方法,其特征在于,所述基于ViT的表情識(shí)別模型包括:依次連接的卷積嵌入模塊、Transformer模塊、多通道特征提取模塊以及輸出模塊。
4.根據(jù)權(quán)利要求3所述的基于自注意力的卒中患者表情識(shí)別方法,其特征在于,所述Transformer模塊包括:Encoder和塊整合網(wǎng)絡(luò)。
5.根據(jù)權(quán)利要求3所述的基于自注意力的卒中患者表情識(shí)別方法,其特征在于,所述通過(guò)人臉表情數(shù)據(jù)集和所述卒中患者表情數(shù)據(jù)集對(duì)所述基于ViT的表情識(shí)別模型進(jìn)行訓(xùn)練,具體包括:
以人臉表情數(shù)據(jù)集作為輸入,以各類表情的置信度為輸出,對(duì)所述基于ViT的表情識(shí)別模型進(jìn)行預(yù)訓(xùn)練,得到預(yù)訓(xùn)練模型;置信度最高的表情類別為預(yù)訓(xùn)練模型的預(yù)測(cè)結(jié)果;
對(duì)所述卒中患者表情數(shù)據(jù)集進(jìn)行增強(qiáng),得到增強(qiáng)后的表情數(shù)據(jù)集;
以所述增強(qiáng)后的表情數(shù)據(jù)集作為輸入,以各類表情的置信度為輸出,對(duì)所述預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的基于ViT的表情識(shí)別模型;置信度最高的表情類別為訓(xùn)練好的基于ViT的表情識(shí)別模型的預(yù)測(cè)結(jié)果。
6.一種基于自注意力的卒中患者表情識(shí)別系統(tǒng),其特征在于,所述系統(tǒng)包括:
數(shù)據(jù)集獲取單元,用于獲取卒中患者表情數(shù)據(jù)集;
構(gòu)建單元,用于構(gòu)建基于ViT的表情識(shí)別模型;
訓(xùn)練單元,用于通過(guò)人臉表情數(shù)據(jù)集和所述卒中患者表情數(shù)據(jù)集對(duì)所述基于ViT的表情識(shí)別模型進(jìn)行訓(xùn)練;
識(shí)別單元,用于通過(guò)訓(xùn)練好的基于ViT的表情識(shí)別模型識(shí)別卒中患者表情的類別。
7.根據(jù)權(quán)利要求6所述的基于自注意力的卒中患者表情識(shí)別系統(tǒng),其特征在于,所述數(shù)據(jù)集獲取單元包括:
表情視頻獲取子單元,用于獲取卒中患者的表情視頻;
標(biāo)注子單元,用于對(duì)所述表情視頻進(jìn)行標(biāo)注,得到各類表情的分段視頻;
圖片處理子單元,用于將各所述分段視頻進(jìn)行圖片化處理,得到各類表情的圖片組;所述圖片組中的圖片包括表情起始狀態(tài)、表情結(jié)束狀態(tài)和表情峰值狀態(tài);
臉部圖片確定子單元,用于框出所述各類表情的圖片組中的人臉,得到臉部圖片;
數(shù)據(jù)集確定子單元,用于將所述臉部圖片進(jìn)行縮放,得到所述卒中患者表情數(shù)據(jù)集。
8.根據(jù)權(quán)利要求6所述的基于自注意力的卒中患者表情識(shí)別系統(tǒng),其特征在于,所述基于ViT的表情識(shí)別模型包括:依次連接的卷積嵌入模塊、Transformer模塊、多通道特征提取模塊以及輸出模塊。
9.根據(jù)權(quán)利要求8所述的基于自注意力的卒中患者表情識(shí)別系統(tǒng),其特征在于,所述Transformer模塊包括:Encoder和塊整合網(wǎng)絡(luò)。
10.根據(jù)權(quán)利要求8所述的基于自注意力的卒中患者表情識(shí)別系統(tǒng),其特征在于,所述訓(xùn)練單元包括:
預(yù)訓(xùn)練模型確定子單元,用于以人臉表情數(shù)據(jù)集作為輸入,以各類表情的置信度為輸出,對(duì)所述基于ViT的表情識(shí)別模型進(jìn)行預(yù)訓(xùn)練,得到預(yù)訓(xùn)練模型;置信度最高的表情類別為預(yù)訓(xùn)練模型的預(yù)測(cè)結(jié)果;
增強(qiáng)數(shù)據(jù)集子單元,用于對(duì)所述卒中患者表情數(shù)據(jù)集進(jìn)行增強(qiáng),得到增強(qiáng)后的表情數(shù)據(jù)集;
表情識(shí)別模型確定子單元,用于以所述增強(qiáng)后的表情數(shù)據(jù)集作為輸入,以各類表情的置信度為輸出,對(duì)所述預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的基于ViT的表情識(shí)別模型;置信度最高的表情類別為預(yù)訓(xùn)練模型的預(yù)測(cè)結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海大學(xué),未經(jīng)上海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210087537.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 獲取表情含義的方法和裝置
- 合成臉部表情圖像的方法和裝置
- 用于移動(dòng)終端的圖形用戶界面
- 表情識(shí)別方法、裝置、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于微表情的圖像識(shí)別方法、裝置以及相關(guān)設(shè)備
- 三維動(dòng)畫(huà)角色表情生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 表情問(wèn)答庫(kù)的構(gòu)建方法、表情搜索方法、裝置及存儲(chǔ)介質(zhì)
- 一種基于重構(gòu)跨域視頻生成對(duì)抗網(wǎng)絡(luò)模型的微表情識(shí)別方法
- 一種虛擬角色表情展現(xiàn)的方法和裝置
- 表情包的處理方法、裝置及智能設(shè)備





