[發(fā)明專利]基于核非負(fù)矩陣分解的字典學(xué)習(xí)和稀疏特征表示的人臉識(shí)別方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201710087134.5 | 申請(qǐng)日: | 2017-02-17 |
| 公開(kāi)(公告)號(hào): | CN106897685A | 公開(kāi)(公告)日: | 2017-06-27 |
| 發(fā)明(設(shè)計(jì))人: | 陳文勝;李育高;潘彬彬;陳波 | 申請(qǐng)(專利權(quán))人: | 深圳大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00 |
| 代理公司: | 深圳市科吉華烽知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙)44248 | 代理人: | 于標(biāo) |
| 地址: | 518000 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 核非負(fù) 矩陣 分解 字典 學(xué)習(xí) 稀疏 特征 表示 識(shí)別 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及人臉識(shí)別技術(shù)領(lǐng)域,尤其涉及基于核非負(fù)矩陣分解的字典學(xué)習(xí)和稀疏特征表示的人臉識(shí)別方法及系統(tǒng)。
背景技術(shù)
近年來(lái),在計(jì)算機(jī)視覺(jué)與模式識(shí)別領(lǐng)域中,人臉識(shí)別已經(jīng)成為最熱門的研究方向之一。人臉識(shí)別系統(tǒng)被廣泛地應(yīng)用于我們的生活當(dāng)中,例如公安刑偵破案、門禁系統(tǒng)、攝像監(jiān)視系統(tǒng)、身份辨識(shí)、網(wǎng)絡(luò)應(yīng)用等。人臉識(shí)別服務(wù)于人們活動(dòng)的各個(gè)重要方面,給人們帶了便利、輕松的生活環(huán)境。
人臉識(shí)別是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。在人臉識(shí)別當(dāng)中,表示一張人臉圖像最流行的方法是通過(guò)一組基圖像的線性組合。非負(fù)矩陣分解(NMF)是一種典型的人臉識(shí)別方法,能夠有效地提取人臉的局部化特征。對(duì)于一個(gè)非負(fù)矩陣X,NMF是為了找到兩個(gè)非負(fù)矩陣W和H使得X≈WH,其中W和H分別被稱為基圖像矩陣和系數(shù)矩陣。W的每一列被叫作基圖像,這些基圖像是一些人臉的局部化特征,比如說(shuō)鼻子、眼睛、耳朵、嘴巴等等。H的每一列是一個(gè)特征,這些特征是由非負(fù)的系數(shù)組成。如果X的每一列代表一張人臉圖像,那么NMF能通過(guò)W中的局部化特征的線性組合來(lái)學(xué)習(xí)X中的每一整張人臉圖像,這與通過(guò)組合物體部分來(lái)形成總體這一直觀概念相符合。然而,非負(fù)矩陣分解算法是一種線性特征提取方法。由于人臉圖像受到不同光照、不同姿勢(shì)、不同表情等因素的影響,人臉圖像的數(shù)據(jù)在模式空間中分布十分復(fù)雜,往往呈現(xiàn)出非線性結(jié)構(gòu),所以,當(dāng)我們應(yīng)用線性的算法(比如NMF)到人臉識(shí)別上時(shí),就很難取得比較好的識(shí)別效果。為此,許多研究人員提出了一些非線性方法來(lái)克服這類問(wèn)題。其中,核方法是一種流行的方法,它能夠有效地提取模式的非線性特征,從而克服人臉圖像數(shù)據(jù)呈現(xiàn)的非線性問(wèn)題。核方法的基本思想是首先通過(guò)利用非線性映射φ將原始空間中的數(shù)據(jù)X映射到一個(gè)高維核空間中,使得新的數(shù)據(jù)φ(X)線性可分,然后在高維核空間中應(yīng)用線性方法對(duì)新的數(shù)據(jù)φ(X)進(jìn)行處理。在核方法中,核空間的維數(shù)一般遠(yuǎn)大于原始樣本空間的維數(shù),甚至有些是無(wú)窮維。作為一種非線性的方法,核非負(fù)矩陣分解(KNMF)是NMF的核方法,它克服了圖像數(shù)據(jù)非線性問(wèn)題。KNMF算法的主要思路是首先將通過(guò)非線性映射后的樣本φ(X),然后用高維核空間中的一組基近似地線性表出φ(X),即φ(X)≈φ(W)H,系數(shù)矩陣H的每一列將作為原始樣本X的新特征。在人臉識(shí)別上,實(shí)驗(yàn)結(jié)果表明KNMF優(yōu)于線性NMF方法。
研究表明,提取的特征越稀疏,越有利于模式分類。因此,在人臉識(shí)別上,一些具有稀疏特征的非負(fù)矩陣分解算法被提出用來(lái)提高算法的識(shí)別性能。為了提高KNMF特征的稀疏度和判別力度,我們前面工作提出了一種分塊核非負(fù)矩陣分解算法(BKNMF)。BKNMF通過(guò)利用了分塊技巧,首先是對(duì)每一類的訓(xùn)練樣本執(zhí)行一種核非負(fù)矩陣分解,然后合并所有類的分解得到總的分解。在BKNMF執(zhí)行的核非負(fù)矩陣分解與KNMF有所不同,前者通過(guò)利用每類的判別信息來(lái)減小類間的距離,因此比后者有更好的判別力度。BKNMF能夠提取稀疏的非線性特征,并且來(lái)自不同類的特征是相互正交的。但是BKNMF的特征稀疏度還可以進(jìn)一步提高,從而使識(shí)別性能提升。非負(fù)稀疏表示(NSR)方法是提取非負(fù)稀疏特征的有效方法。NSR的主要任務(wù)是解決一個(gè)帶有l(wèi)0范數(shù)正則項(xiàng)的平方最小化問(wèn)題。然而,這個(gè)最小化問(wèn)題是一個(gè)NP難度問(wèn)題。幸運(yùn)的是,對(duì)非負(fù)稀疏表示的深入研究表明:當(dāng)這個(gè)NP難度問(wèn)題的解充分稀疏時(shí),它能夠用l1范數(shù)正則項(xiàng)代替l0范數(shù)正則項(xiàng),從而轉(zhuǎn)化成一個(gè)帶有l(wèi)1范數(shù)正則項(xiàng)的凸優(yōu)化問(wèn)題。當(dāng)數(shù)據(jù)呈現(xiàn)出非線性結(jié)構(gòu)時(shí),非線性的NSR通常比線性的NSR取得的分類會(huì)效果更好。作為一種非線性的NSR方法,基于核的非負(fù)稀疏表示(KNSR)有效地克服了數(shù)據(jù)呈非線性結(jié)構(gòu)問(wèn)題。KNSR的關(guān)鍵在于其稀疏學(xué)習(xí)字典,一般直接用映射后的訓(xùn)練樣本矩陣作為稀疏表示字典,基于該字典在高維核空間中來(lái)提取新數(shù)據(jù)的非負(fù)稀疏特征。雖然KNSR能夠提取數(shù)據(jù)的稀疏非線性特征,但是它的字典沒(méi)有利用到模式的類標(biāo)信息,即它是一種無(wú)監(jiān)督的方法。因此,KNSR的性能在分類任務(wù)中會(huì)受到影響。本專利擬通過(guò)利用訓(xùn)練樣本的類標(biāo)信息來(lái)構(gòu)造高性能稀疏學(xué)習(xí)字典,以提升KNSR的識(shí)別性能。
總之,在人臉識(shí)別中,雖然有各種各樣方法被提出來(lái)克服各種問(wèn)題,但是這些現(xiàn)有的方法都普遍存在一些問(wèn)題:(1)當(dāng)數(shù)據(jù)在模式空間中呈非線性分布時(shí),線性算法的效果并不理想;(2)許多算法都是無(wú)監(jiān)督的方法,即沒(méi)有用到樣本的類標(biāo)信息,通常有監(jiān)督的方法都會(huì)比無(wú)監(jiān)督的方法取得的效果好;(3)許多方法提取的特征不足夠稀疏,這會(huì)降低算法分類能力。
關(guān)鍵詞解釋:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳大學(xué),未經(jīng)深圳大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710087134.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于非線性壓縮感知與字典學(xué)習(xí)的壓縮光譜成像方法
- 一種基于核機(jī)器學(xué)習(xí)的非負(fù)矩陣分解人臉識(shí)別方法及系統(tǒng)
- 基于非負(fù)矩陣分解和核FCM的多時(shí)相遙感影像變化檢測(cè)方法
- 基于核非負(fù)矩陣分解的字典學(xué)習(xí)和稀疏特征表示的人臉識(shí)別方法及系統(tǒng)
- 基于核非負(fù)矩陣分解的人臉識(shí)別方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 一種非線性非負(fù)矩陣分解人臉識(shí)別構(gòu)建方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 基于加性高斯核的核非負(fù)矩陣分解人臉識(shí)別方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)
- 一種基于非負(fù)張量分解的交通擁堵熱度時(shí)空預(yù)測(cè)方法
- 自構(gòu)余弦核空間中人臉數(shù)據(jù)非負(fù)特征表示和識(shí)別方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)
- 一種基于非負(fù)張量環(huán)的彩色圖片聚類方法
- 在集成電路器件中求解線性矩陣
- 矩陣計(jì)算裝置、矩陣計(jì)算方法
- 一種數(shù)據(jù)聚類的方法、裝置及Spark大數(shù)據(jù)平臺(tái)
- 適用于黑白圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 矩陣
- 矩陣/密鑰生成裝置、矩陣/密鑰生成系統(tǒng)、矩陣結(jié)合裝置、矩陣/密鑰生成方法、程序
- 矩陣運(yùn)算電路、矩陣運(yùn)算裝置及矩陣運(yùn)算方法
- 矩陣乘法計(jì)算方法和裝置
- 數(shù)據(jù)讀取方法、裝置、介質(zhì)和計(jì)算設(shè)備





