[發明專利]一種基于視覺詞匯本集體的不變性識別方法無效
| 申請號: | 201010132099.2 | 申請日: | 2010-03-25 |
| 公開(公告)號: | CN101807259A | 公開(公告)日: | 2010-08-18 |
| 發明(設計)人: | 危輝;羅會蘭 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;盛志范 |
| 地址: | 20043*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 視覺 詞匯 集體 不變性 識別 方法 | ||
技術領域
本發明屬于模式識別、計算機視覺、圖像理解技術領域,具體涉及一種不變性識別方法。?
背景技術
目前計算機視覺面臨的挑戰是不變性識別,它已經成為眾多專家學者研究的一個熱點。不變性識別是指在視角,尺度,光照條件發生變化時,或存在遮擋,背景噪聲,一定程度的變形時也能準確將物體識別出來。目前存在的研究方法主要有:?
1.基于全局形狀的方法。為了實現不變性識別,許多早期的文獻,其中典型的有文獻[1],應用幾何方法提取邊輪廓來表示物體。這種表示方法對于光照有不變性,而且使得二維或三維姿勢的決定相對簡單。但是這種方法依賴于物體輪廓,它們假設圖像中的邊輪廓能可靠發現,而且這種方法要求識別目標的幾何輪廓已經事先知道。?
2.基于全局外觀統計的方法。文獻[2]中使用局部外觀的聯合統計直方圖來表示物體。文獻[3]中使用全局圖像方法,利用全局外觀統計信息來分類物體。這種全局方法,盡管它比較簡單,但不變性識別效果欠佳,且由于沒有對局部建模,所以對背景噪聲和遮擋敏感。?
3.基于局部區域的方法,主要思想是使用一個區域檢測器來找到一個感興趣的圖像部分(局部)的集合[4],[5],然后用某種描述子[6-8]來表示它們,識別成為匹配圖像中的描述子與已知物體的描述子的過程[6],[9-11],如果找到充足的匹配則認為物體識別到了。要想保持對某種變換的不變性,則區域和區域的表示方法均要對此變換保持不變性。這種將對象模型化成局部的集合(collections?of?parts)的思想最先由Fischler和Elschlager[12]在計算機視覺領域中提出。由于這種模型具有很強的靈活性,能很好處理物體類實例的多樣性和各種變換及遮擋,所以近年來這方面的研究日益增多[6],[13-20]。目前這種基于局部區域的方法大多只利用了局部紋理或亮度信息,對于局部幾何形狀信息,以及局部間關系的信息沒有利用上,所以大多數的研究只針對特定類有比較好的效果,而且在物體的定位方面效果欠佳。?
當前對不變性識別研究的共識是[21]:第一,物體的形狀和外觀復雜且同類物體間差異大,所以模型應該是豐富的(包含很多的參數,使用混合描述);第二,一個給定類內的物體的外觀應該是高度變化的,所以模型應該是靈活的(允許參數的變化);第三,為了?處理類內物體變化和遮擋,模型應該由特征組成,或者說部分組成,這些特征不必在所有的實例中檢測到,這些局部的相互位置構成了進一步的模型信息;第四,使用先驗知識來模型化類是困難的,最好是從訓練樣本中學習模型;第五,必須考慮計算效率。?
所以利用機器學習的方法來進行不變性識別研究是當前的一種研究趨勢。早期的針對特定物體人工建立一個固定模型的方法局限性非常大,根本不可能推廣到多類物體和不同應用場景下。但是目前對不變性識別的學習監督程度普遍比較強,有的要求將圖像預先分割,有的要求對目標物體的矩形定位,有的要求對圖像給予類標簽,除此之外最弱的監督樣本也會要求樣本中目標物體以絕對優勢占有樣本的中心位置,而且所有的樣本要有同樣的大小。監督樣本的獲取代價非常大,那么這就意味著不可能獲取很多的樣本,也不可能所有類的樣本都能獲取到,這就限制了學習的性能和學習的寬度。?
人類的視覺系統會并行利用多種信息來識別物體,并且對于每種不變性都能學習到一個模型,而這正是集成學習技術的思想。集成學習是近年來發展起來的一種學習技術,集成學習(Ensemble?Learning)是指利用多個學習機解決同一個問題。最近也有利用集成學習技術來解決不變性識別問題的文獻,但都只限于使用單個信息,沒有將集成學習的思想應用到多個信息的利用上去,而只是利用監督式集成學習技術來做后續的分類工作,最典型的應用是boosting方法[22-25]。非監督式集成學習技術或者說聚類集成技術近年來得到了一定的發展,為減少不變性識別的監督程度和利用集成學習技術的研究提供了基礎。?
本項發明的主要貢獻在于提出了一種基于非監督式集成學習技術進行不變性識別的方法。本發明能有效減少不變性識別的監督程度,綜合利用多種有效信息,并行學習物體模型,有效提高不變性識別的效率和準確度。?
發明內容
為了解決傳統物體識別中存在的模型過于復雜,監督程度過強和魯棒性差的問題,本發明提供了一種利用詞匯本集體來并行利用圖像中存在的多種信息識別物體的方法。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010132099.2/2.html,轉載請聲明來源鉆瓜專利網。





