[發(fā)明專(zhuān)利]基于分部件和壓縮字典稀疏表示的低分辨率人臉識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910062329.3 | 申請(qǐng)日: | 2019-01-23 |
| 公開(kāi)(公告)號(hào): | CN109800719B | 公開(kāi)(公告)日: | 2020-08-18 |
| 發(fā)明(設(shè)計(jì))人: | 肖瓊琳;楊若瑜;李俊 | 申請(qǐng)(專(zhuān)利權(quán))人: | 南京大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00 |
| 代理公司: | 江蘇圣典律師事務(wù)所 32237 | 代理人: | 胡建華;于瀚文 |
| 地址: | 210023 江蘇省南*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 部件 壓縮 字典 稀疏 表示 分辨率 識(shí)別 方法 | ||
本發(fā)明公開(kāi)了基于分部件和壓縮字典稀疏表示的低分辨率人臉識(shí)別方法,屬于信號(hào)處理、模式識(shí)別、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)領(lǐng)域。本發(fā)明構(gòu)造字典時(shí)挑選視頻中能稀疏表示所有視頻幀的圖像作為代表幀,然后使用這些代表幀與其鏡像的HOG特征構(gòu)造部件字典。測(cè)試時(shí),用字典線性表示測(cè)試視頻的每一幀,并增加反饋機(jī)制更正異常的識(shí)別結(jié)果,最后投票獲得視頻分類(lèi)的結(jié)果。發(fā)明將稀疏表示應(yīng)用到視頻人臉識(shí)別中,保持了稀疏表示對(duì)遮擋和噪聲的魯棒性,并加入其它步驟提高它在較大規(guī)模的低分辨率視頻人臉識(shí)別中的效果和效率,彌補(bǔ)它在光照變化等條件下的不足。
技術(shù)領(lǐng)域
本發(fā)明屬于信號(hào)處理、模式識(shí)別、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)領(lǐng)域,尤其涉及基于分部件和壓縮字典稀疏表示的低分辨率人臉識(shí)別方法。
背景技術(shù)
20世紀(jì)后期開(kāi)始,硬件的發(fā)展迅速,數(shù)字圖像成為當(dāng)代社會(huì)的重要信息攜帶品。隨著計(jì)算機(jī)視覺(jué)技術(shù)的不斷發(fā)展,越來(lái)越多的技術(shù)成為了實(shí)際應(yīng)用的產(chǎn)品。人臉識(shí)別是基于人的面部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù),它具有非侵?jǐn)_性,便捷性,非接觸性等優(yōu)點(diǎn)。人臉識(shí)別技術(shù)發(fā)展非常迅速,特別是深度神經(jīng)網(wǎng)絡(luò)的問(wèn)世讓機(jī)器人臉識(shí)別近似于甚至超過(guò)人眼的識(shí)別能力。但雖然在正常的環(huán)境中,如光照良好,人的姿勢(shì)不變情況下人臉識(shí)別技術(shù)表現(xiàn)優(yōu)異,在光照差、人體姿勢(shì)偏轉(zhuǎn)幅度大、遮擋等情況下,人臉識(shí)別技術(shù)還期待提高。
與圖像相比,視頻含有時(shí)序、動(dòng)作等更多的信息,有助于提高人臉識(shí)別準(zhǔn)確率,從而越來(lái)越受到關(guān)注。但是視頻設(shè)備雖然變得普及,視頻的獲取也越來(lái)越容易,視頻的分辨率卻不如圖像的分辨率高。尤其是監(jiān)控視頻中的人臉識(shí)別是一個(gè)很重要的應(yīng)用場(chǎng)景,而它的分辨率又比一般的視頻更低,光照、姿態(tài)等也更差。因此,視頻人臉識(shí)別不止面臨著和圖像人臉識(shí)別同樣的問(wèn)題,還帶有低分辨率的問(wèn)題。
現(xiàn)有的視頻人臉識(shí)別方法通常分為兩種,一種方法對(duì)整段視頻進(jìn)行建模,然后通過(guò)度量?jī)蓚€(gè)模型之間的距離進(jìn)行人臉識(shí)別。比如講提取一段視頻的統(tǒng)計(jì)屬性,或者將視頻建模為幾個(gè)高斯分布的集合,又或者求視頻的凸包,這種方法往往計(jì)算復(fù)雜,訓(xùn)練耗時(shí),且對(duì)短視頻的識(shí)別效果較差。另一種方法對(duì)每一幀圖像進(jìn)行識(shí)別,然后融合所有幀的識(shí)別結(jié)果。這種方法在長(zhǎng)視頻識(shí)別中效率較低但在短視頻的人臉識(shí)別中具有優(yōu)勢(shì),同時(shí)它能與最先進(jìn)的圖像人臉識(shí)別方法結(jié)合從而提高準(zhǔn)確率,且在需要輸出單幀的中間結(jié)果的場(chǎng)景下不可被替代。稀疏表示、協(xié)同表示方法都是單幀圖像識(shí)別中表現(xiàn)優(yōu)異的方法,結(jié)合到視頻識(shí)別中也取得了不錯(cuò)的結(jié)果。
但容易發(fā)現(xiàn)稀疏表示的字典大小影響識(shí)別速度,字典內(nèi)容影響識(shí)別準(zhǔn)確性。所以近年來(lái),人們常通過(guò)改進(jìn)字典來(lái)提高稀疏表示方法的效果。為了讓字典變得緊湊,可以使用兩種方法。一種方法使用優(yōu)化方法從全部的訓(xùn)練圖像中構(gòu)建一個(gè)字典,這一類(lèi)方法每次加入新的訓(xùn)練樣本都需要重新進(jìn)行訓(xùn)練,使訓(xùn)練集更新困難。另一種讓字典變得緊湊的方法是從原始的訓(xùn)練圖像集中挑選能代表整個(gè)幾集合的子集。相比字典學(xué)習(xí)方法,這一類(lèi)方法仍然使用一張圖像代表一個(gè)原子,當(dāng)新的訓(xùn)練圖像出現(xiàn)時(shí)可以直接插入到字典中,免去重新訓(xùn)練的繁瑣步驟。針對(duì)圖像中的識(shí)別難點(diǎn),也有不同的使用稀疏表示方法的解決方案被提出。比如對(duì)不同姿勢(shì)的測(cè)試集使用不同姿勢(shì)的字典,提高了計(jì)算效率,但受限于姿勢(shì)判斷方法。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了基于分部件和壓縮字典稀疏表示的低分辨率人臉識(shí)別方法,包含以下步驟:
步驟1,用樣本庫(kù)為稀疏表示構(gòu)造字典;
步驟2,基于字典進(jìn)行人臉識(shí)別,得到分類(lèi)結(jié)果。
步驟1包括:
步驟1-1,將人的任意段視頻加入樣本庫(kù);
步驟1-2,將樣本庫(kù)的視頻按照每秒f(一般為30)幀的幀率拆分成圖像,再使用seetaface算法檢測(cè)所有圖像的人臉位置,將人臉位置的圖像截取出來(lái),調(diào)整為統(tǒng)一的32*40像素大小,最后進(jìn)行灰度化和Gamma校正(伽馬校正)圖像處理,seetaface算法具有檢測(cè)速度快,人臉定位準(zhǔn)確的優(yōu)點(diǎn),Gamma校正能調(diào)整圖像質(zhì)量,增強(qiáng)光照魯棒性。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910062329.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種電子字典數(shù)據(jù)更新系統(tǒng)及其方法
- 一種階梯字典
- 一種基于網(wǎng)絡(luò)字典的無(wú)損數(shù)據(jù)壓縮方法
- 數(shù)據(jù)冗余消除DRE字典確認(rèn)方法和設(shè)備
- 一種對(duì)字典和字典項(xiàng)進(jìn)行處理的方法及服務(wù)器
- 一種數(shù)據(jù)字典的處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種基于深度矩陣字典的字典學(xué)習(xí)方法
- 一種字典轉(zhuǎn)碼方法、裝置、存儲(chǔ)介質(zhì)及終端
- 一種基于不相干性聯(lián)合字典學(xué)習(xí)的圖像分類(lèi)方法
- 一種基于Kubernetes容器配置字典和保密字典的實(shí)現(xiàn)方法及其系統(tǒng)





