[發(fā)明專利]基于特征譜正則化的格拉斯曼流形判別分析圖像識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910943071.8 | 申請(qǐng)日: | 2019-09-30 |
| 公開(公告)號(hào): | CN110781766B | 公開(公告)日: | 2023-05-19 |
| 發(fā)明(設(shè)計(jì))人: | 譚恒良;高鷹;杜嬌;楊朔 | 申請(qǐng)(專利權(quán))人: | 廣州大學(xué) |
| 主分類號(hào): | G06V20/40 | 分類號(hào): | G06V20/40;G06V10/774;G06V10/74;G06V10/77;G06V10/764;G06F17/16 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 肖宇揚(yáng);江銀會(huì) |
| 地址: | 510006 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 特征 正則 格拉斯曼 流形 判別分析 圖像 識(shí)別 方法 | ||
本發(fā)明公開了基于特征譜正則化的格拉斯曼流形判別分析圖像識(shí)別方法,包括:將標(biāo)準(zhǔn)正交基集合組成的格拉斯曼流形映射到希爾伯特空間得到向量組;依據(jù)圖嵌入理論框架建立局部保持矩陣并通過(guò)權(quán)重框架函數(shù)執(zhí)行正則化操作得到變換矩陣,通過(guò)變換矩陣對(duì)向量組投影得到新的樣本空間;對(duì)新的樣本空間結(jié)合權(quán)重鄰接矩陣求解方程得到降維投影矩陣,根據(jù)變換矩陣與其組合得到的最終矩陣提取訓(xùn)練視頻圖像集合與待識(shí)別視頻圖像集合的降維特征并進(jìn)行相似度比較得到識(shí)別結(jié)果。本發(fā)明利用特征譜正則化技術(shù)解決了GDA方法在判別分析中因類內(nèi)散度矩陣奇異而導(dǎo)致求逆不穩(wěn)定、泛化能力差的問(wèn)題;且加入圖嵌入理論框架使得算法能更好地保持局部信息以獲得更好的識(shí)別結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識(shí)別技術(shù)領(lǐng)域,尤其涉及一種基于特征譜正則化的格拉斯曼流形判別分析圖像識(shí)別方法。
背景技術(shù)
圖像識(shí)別是人工智能的分支,屬于模式識(shí)別范疇,且圖像識(shí)別的相關(guān)研究已經(jīng)廣泛應(yīng)用于人臉識(shí)別、車牌識(shí)別、文字識(shí)別等方面并取得了巨大的成功,但是在復(fù)雜光照、低分辨率、圖像模糊等復(fù)雜情況下,圖像識(shí)別仍然面臨著巨大的挑戰(zhàn)。隨著計(jì)算機(jī)技術(shù)、視頻監(jiān)控技術(shù)、網(wǎng)絡(luò)技術(shù)的快速發(fā)展,以及電子商務(wù)、社交網(wǎng)絡(luò)、網(wǎng)絡(luò)視頻的普及,目前常常可以獲得同一個(gè)物體的多幅圖像組成的圖像集合或視頻,利用圖像集合或視頻進(jìn)行圖像識(shí)別能夠有效獲得更多的可判別信息,相較于傳統(tǒng)單幅圖像識(shí)別方法有較強(qiáng)的優(yōu)勢(shì)。單幅圖像識(shí)別方法普遍以單幅圖像作為分析研究對(duì)象,其顯著特點(diǎn)在于識(shí)別階段只采單幅圖像的信息去進(jìn)行圖像匹配,而使用圖像集合或視頻的圖像識(shí)別方法,無(wú)論在訓(xùn)練過(guò)程或者識(shí)別過(guò)程中都以圖像集合或一段視頻為單位進(jìn)行匹配,其中,基于視頻的圖像識(shí)別方法(簡(jiǎn)稱“視頻圖像識(shí)別方法”)也可以稱之為圖像集識(shí)別方法。
目前,大部分視頻圖像識(shí)別方法一般都是建立在歐氏空間中,例如:概率模型、線性子空間、稀疏表示、尺度學(xué)習(xí)、仿射/凸包模型等方法。其中,基于線性子空間進(jìn)行圖像匹配的視頻圖像識(shí)別方法(Mutual?Subspace?Method,MSM)是使用最為廣泛的一種,其利用了兩個(gè)線性子空間之間的相似度度量規(guī)則——典型相關(guān)角(canonical?angles),進(jìn)行相似度的度量,如圖1所示,視頻人臉圖像幀可以組成不同的圖像集合,X1和X2代表不同人的一個(gè)視頻圖像集合,然后分別將其各自表達(dá)成不同的線性子空間,通過(guò)它們之間的典型相關(guān)角θ可得到兩個(gè)視頻圖像集合之間的相似性,從而進(jìn)行識(shí)別。然而,大量相關(guān)研究表明,許多視覺特征(如圖像的線性子空間、協(xié)方差矩陣、形狀特征等)常常并不處于我們所熟知的歐氏空間中,而是存在于具有一定性質(zhì)的扭曲的拓?fù)淇臻g——黎曼流形(Riemannianmanifold)上,黎曼流形是局部具有歐氏空間性質(zhì)的拓?fù)淇臻g,從幾何上看,其拓?fù)浣Y(jié)構(gòu)是一個(gè)扭曲的拓?fù)淇臻g,且目前已經(jīng)有大量方法使用圖像的線性子空間、協(xié)方差矩陣、形狀特征等視覺特征作為黎曼流形上的元素,并成功應(yīng)用于視頻圖像識(shí)別任務(wù)。圖像集合的線性子空間實(shí)際上屬于視覺統(tǒng)計(jì)特征,研究認(rèn)為,這些視覺統(tǒng)計(jì)特征可能存在于非歐空間格拉斯曼(Grassmann)流形上,格拉斯曼流形在視頻圖像識(shí)別上已經(jīng)得到了廣泛的應(yīng)用,其被定義為一組子空間的集合,是黎曼流形的一種特殊形式,通過(guò)定義格拉斯曼流形上的距離即可實(shí)現(xiàn)圖像集合與圖像集合之間的相似度度量,如流形的測(cè)地距離,且除了流形的測(cè)地距離,也可根據(jù)典型相關(guān)角定義多種格拉斯曼流形距離。格拉斯曼流形判別分析(GrassmannDiscriminant?Analysis,GDA)利用格拉斯曼核函數(shù)將流形上的視覺統(tǒng)計(jì)特征重新映射到歐氏空間中,并在此映射的空間中使用線性判別分析(Linear?Discriminant?Analysis,LDA)方法。眾所周知,傳統(tǒng)的線性判別分析(LDA)方法在求解最優(yōu)投影矩陣的過(guò)程中,通常需要求類內(nèi)散度矩陣的逆。但是實(shí)踐發(fā)現(xiàn),常常由于訓(xùn)練樣本數(shù)量有限且特征維度較高,從而導(dǎo)致類內(nèi)散度矩陣是奇異的,進(jìn)而導(dǎo)致類內(nèi)散度矩陣的逆并不存在的情況。可見,當(dāng)前的GDA方法存在因類內(nèi)散度矩陣奇異而導(dǎo)致的求逆不穩(wěn)定及泛化能力差的問(wèn)題。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州大學(xué),未經(jīng)廣州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910943071.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 廣義格拉斯曼碼本構(gòu)造方法及基于其的反饋方法
- 一種適用于3DMIMO系統(tǒng)的基于雙碼本的預(yù)編碼方法
- 一種高光譜圖像分類的方法及裝置
- 基于格拉斯曼核的學(xué)習(xí)方法
- 一種直推式的低秩張量判別性分析方法
- 一種基于格拉斯曼流形的密集非剛性運(yùn)動(dòng)結(jié)構(gòu)算法
- 基于流形深度學(xué)習(xí)和極限學(xué)習(xí)機(jī)的圖像集分類系統(tǒng)及方法
- 一種基于對(duì)稱矩陣空間子空間學(xué)習(xí)的格拉斯曼流形域自適應(yīng)方法
- 一種基于深度神經(jīng)網(wǎng)絡(luò)子空間編碼的圖像分類方法
- 一種基于流形對(duì)齊的軟件缺陷預(yù)測(cè)方法及系統(tǒng)





