[發(fā)明專利]基于非線性張量分解與視角流形的多視角人臉識別方法無效
| 申請?zhí)枺?/td> | 200810232342.0 | 申請日: | 2008-11-19 |
| 公開(公告)號: | CN101436250A | 公開(公告)日: | 2009-05-20 |
| 發(fā)明(設計)人: | 高新波;田春娜;李潔;張穎;劉振興;鄧成;肖冰;牛振興;溫靜;王秀美 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 陜西電子工業(yè)專利中心 | 代理人: | 王品華;黎漢華 |
| 地址: | 71007*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 非線性 張量 分解 視角 流形 識別 方法 | ||
技術領域
本發(fā)明屬于模式識別與計算機視覺技術領域,特別涉及多視角人臉識別方法,可用于生物特征識別領域中不同視角下的人臉檢索和識別。
背景技術
生物特征識別在今后數(shù)年內將成為安全及IT產業(yè)最為重要的技術革命之一。現(xiàn)代研究表明人的虹膜、指紋和掌形等均可用于身份鑒定。與其它生物特征識別技術或系統(tǒng)相比,人臉識別系統(tǒng)具有識別精度高、方便、友好、自然等優(yōu)點。所以人臉識別是易于被人們接受的非侵犯性身份識別方法。人臉在成像過程受場景結構和人物狀態(tài)等各種因素的相互作用,所獲得的人臉圖像在光照、表情、視角及噪聲等方面具有多樣性和復雜性。由美國國防部高級研究項目署和美國陸軍研究實驗室的人臉識別技術項目組聯(lián)合建立的評測數(shù)據(jù)庫上的測試結果表明,目前的人臉識別系統(tǒng),在測試圖像和訓練圖像中人臉視角接近的情況下,識別率很高;隨著人臉視角變化的加劇,識別性能顯著下降。這說明降低視角變化的影響是自動人臉識別技術走向實用化必須解決的關鍵問題之一。
目前多視角人臉識別的研究成果主要集中為以下兩類:
第一類是基于3D人臉建模的多視角人臉識別技術。3D人臉識別在根本上需要將人臉3D表面結構等本質屬性與表情、胡須、光照等具有自身可變性或易受外部因素影響的屬性分離,以進行識別。3D人臉識別方法最初采用人臉曲率為特征,日本Ritsumeikan大學的Tanaka等采用主曲率的大小及方向信息為特征,用擴展高斯圖表示每個人臉的曲面數(shù)據(jù),最后計算擴展高斯圖的Fisher球形相關度作為相似度來實現(xiàn)識別。德國馬普學會計算機科學研究所的Blanz等提出3D人臉形變模型,對于待識別人臉,一是直接用擬合獲得的一系列參數(shù)作為特征,進行識別;二是通過擬合的特定參數(shù),結合3D形變人臉模型,合成特定姿態(tài)和光照條件下的2D人臉圖像進行識別。新加坡南陽理工大學的Chua等提出基于標識點的人臉識別方法。以色列技術工程學院的Alexander等通過將3D人臉的深度數(shù)據(jù)和灰度紋理根據(jù)保局映射轉換到2D圖像上進行識別。美國加利福尼亞大學的Xu等提出基于幾何集成的表面流形模型,通過一個四線性流形來表征人臉的光照、姿態(tài)、身份和形變信息。該模型中的形變子空間將二維圖像與三維人臉模型對應起來,實現(xiàn)多姿態(tài)人臉的跟蹤與識別。然而3D人臉識別需要昂貴的數(shù)據(jù)采集設備,且計算量很大。
第二類是基于2D人臉圖像的多視角人臉識別技術。其中線性和非線性子空間分析的方法因其實用性得到越來越多研究人員的重視。美國MIT的Turk等最早提出用主成分分析進行人臉識別,它對單一條件下的人臉圖像有相當高的識別率,而涉及到多因素變化時,其識別性能顯著下降。美國斯坦福大學的Tenenbaum等人建立人臉的雙線性模型用于將人臉圖像的身份和視角分離,從而進行較精細的人臉識別。美國紐約大學的Vasilescu等將雙線性模型推廣到基于高階張量分析的多線性模型,提出基于TensorFace的方法來處理多因素變化下的人臉識別,見文獻“M.Alex?O.Vasilescu,DemetriTerzopoulos.Multilinear?image?analysis?for?facial?recognition.Proceedings?of?the?InternationalConference?on?Pattern?Recognition,Quebec?City,3:511-514,Canada.2002.”。上述方法均屬于線性方法,無法精確描述人臉視角變化引起的圖像空間的非線性問題。一類方法是采用核子空間分析方法,德國GMD-FIRST研究所的Scho1kopf等提出基于核主成分分析的方法,將人臉數(shù)據(jù)由原始的圖像空間投影到高維希爾伯特空間,用高維空間中的線性來表示低維空間中的非線性。另一種解決非線性的思路是采用基于流形學習的降維方法,實現(xiàn)人臉空間的非線性描述。美國斯坦福大學的Tenenbaum等人提出的Isomap,倫敦大學學院的Roweis等提出的局部線性嵌入和美國芝加哥大學的He等提出的LaplacianEigenmaps屬于此類。美國伊力諾依大學的Lee等提出用在線學習的方法,構建視頻中人臉的表面流形概率模型,從而實現(xiàn)視頻中視角變化情況下的人臉識別。
目前,基于非線性子空間分解的方法是雖然是人臉識別研究的主流方向之一。但對于多因素變化的復雜人臉圖像,這種方法由于不能建立一個統(tǒng)一的人臉表面模型,因而無法實現(xiàn)對各種影響人臉生成的因素分離,也無法準確描述人臉空間的線性及非線性變化。
發(fā)明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經(jīng)西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810232342.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:川芎優(yōu)質高產栽培技術
- 下一篇:等離子體顯示面板裝置





