[發(fā)明專利]一種結(jié)合多個(gè)興趣點(diǎn)檢測子的物體類識別方法有效
| 申請?zhí)枺?/td> | 201210004545.0 | 申請日: | 2012-01-09 |
| 公開(公告)號: | CN102609715A | 公開(公告)日: | 2012-07-25 |
| 發(fā)明(設(shè)計(jì))人: | 羅會(huì)蘭;井福榮;張彩霞 | 申請(專利權(quán))人: | 江西理工大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 341000 江*** | 國省代碼: | 江西;36 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 結(jié)合 興趣 檢測 物體 識別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于模式識別、計(jì)算機(jī)視覺、圖像理解技術(shù)領(lǐng)域,具體涉及一種物體類識別方法。
背景技術(shù)
物體類識別是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)關(guān)鍵問題。物體類模型必須處理好類內(nèi)變化和類間相似的平衡。人類可以很容易的識別許多的物體類,但是對于計(jì)算機(jī)和機(jī)器人來說,這個(gè)任務(wù)還是極端有挑戰(zhàn)性的。在物體類層面,光照條件的變化,幾何變形,遮擋和背景噪聲等等都給有效學(xué)習(xí)和穩(wěn)健識別帶來許多的挑戰(zhàn)。除此之外,物體類識別還要克服類內(nèi)不同實(shí)例間的極大差異。
一副圖像包含許多的信息,怎樣特征化一副圖像,使之能有效且高效的用來識別。這個(gè)問題是非常困難的,并且是依賴于識別任務(wù)的。Bag-of-words模型特征化方法,近來非常流行,因?yàn)檫@種方法簡單而又有效。這種方法的基本思想是把圖像看成是稀疏興趣點(diǎn)(興趣區(qū)域,或稱為顯著性區(qū)域)的集合。它來源于文本分析中的語素方法,基本思想是把圖像看成是獨(dú)立塊的稀疏集合,從圖像中采樣一些代表性區(qū)域塊,然后單獨(dú)為每塊描述特征,使用描述空間的分布來表示圖像。
興趣點(diǎn)檢測子可以劃分成三類:基于輪廓的,基于灰度的和基于參數(shù)模型的。許多計(jì)算機(jī)視覺任務(wù)依賴于低層特征,結(jié)果很大程度上受所使用檢測子的影響。在計(jì)算機(jī)視覺領(lǐng)域中,檢測出具有一類變換不變性的區(qū)域達(dá)到了一定程度的成熟。這些不變性區(qū)域檢測方法應(yīng)用在非常不同的領(lǐng)域中,包括基于模型的識別和物體分類領(lǐng)域中。由不同的檢測子提取出的興趣點(diǎn)可能包含有不同的信息內(nèi)容。本發(fā)明提供了一種新穎的方法來結(jié)合多個(gè)檢測子用于分類圖像。集成方法提供了一種有效的融合方式來處理不同興趣點(diǎn)所包含的信息。這種集成構(gòu)架也匹配了人類視覺系統(tǒng)的機(jī)制,即能并行接受多種不同線索來識別不同的物體類。
當(dāng)前對物體類識別研究的共識是:第一,物體的形狀和外觀復(fù)雜且同類物體間差異大,所以模型應(yīng)該是豐富的(包含很多的參數(shù),使用混合描述);第二,類內(nèi)物體的外觀應(yīng)該是高度變化的,所以模型應(yīng)該是靈活的(允許參數(shù)的變化);第三,為了處理類內(nèi)物體變化和遮擋,模型應(yīng)該由特征組成,或者說部分組成,這些特征不必在所有的實(shí)例中檢測到,這些局部的相互位置構(gòu)成了進(jìn)一步的模型信息;第四,使用先驗(yàn)知識來模型化類是困難的,最好是從訓(xùn)練樣本中學(xué)習(xí)模型;第五,必須考慮計(jì)算效率。
所以利用機(jī)器學(xué)習(xí)的方法來進(jìn)行物體類識別研究是當(dāng)前的一種研究趨勢。早期的針對特定物體類人工建立一個(gè)固定模型的方法局限性非常大,根本不可能推廣到多類物體和不同應(yīng)用場景下。但是目前對物體類識別的學(xué)習(xí)監(jiān)督程度普遍比較強(qiáng),有的要求將圖像預(yù)先分割,有的要求對目標(biāo)物體的矩形定位,有的要求對圖像給予類標(biāo)簽,除此之外最弱的監(jiān)督樣本也會(huì)要求樣本中目標(biāo)物體以絕對優(yōu)勢占有樣本的中心位置,而且所有的樣本要有同樣的大小。監(jiān)督樣本的獲取代價(jià)非常大,那么這就意味著不可能獲取很多的樣本,也不可能所有類的樣本都能獲取到,這就限制了學(xué)習(xí)的性能和學(xué)習(xí)的寬度。
人類的視覺系統(tǒng)會(huì)并行利用多種信息來識別物體,并且對于每種不變性都能學(xué)習(xí)到一個(gè)模型,而這正是集成學(xué)習(xí)技術(shù)的思想。非監(jiān)督式集成學(xué)習(xí)技術(shù)或者說聚類集成技術(shù)近年來得到了一定的發(fā)展,為減少物體類識別的監(jiān)督程度和利用集成學(xué)習(xí)技術(shù)的研究提供了基礎(chǔ)。目前存在許多的興趣點(diǎn)檢測子,但哪種興趣點(diǎn)檢測子更適合于當(dāng)前的任務(wù)或者說性能怎樣很難做出正確解答。本發(fā)明提出使用不同的檢測子來獲得圖像的不同線索。在不同檢測子檢測出的興趣點(diǎn)上,建立不同的視覺字典。基于不同的視覺字典,同一個(gè)訓(xùn)練圖像集能量化得到不同的訓(xùn)練矢量集,它們捕獲了圖像不同方面的信息,基于不同的訓(xùn)練矢量集上,可以學(xué)習(xí)得到不同的成員分類器。使用這些學(xué)習(xí)了不同方面物體模型特征的分類器來分類新的圖像時(shí),不同成員分類器給出它們自己的答案,集成它們可以得到性能的提升。
本項(xiàng)發(fā)明的主要貢獻(xiàn)在于提出了一種基于非監(jiān)督式集成學(xué)習(xí)技術(shù)進(jìn)行物體類識別的方法。本發(fā)明能有效減少物體類識別的監(jiān)督程度,綜合利用多種有效信息,并行學(xué)習(xí)物體模型,有效提高物體類識別的效率和準(zhǔn)確度。
發(fā)明內(nèi)容
為了解決傳統(tǒng)物體類識別中存在的模型過于復(fù)雜,監(jiān)督程度過強(qiáng)和魯棒性差的問題,本發(fā)明提供了一種利用字典集體來并行利用圖像中存在的多種信息識別物體類的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江西理工大學(xué),未經(jīng)江西理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210004545.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 興趣點(diǎn)系統(tǒng)、興趣點(diǎn)信息系統(tǒng)以及下載多個(gè)興趣點(diǎn)的方法
- 用戶興趣點(diǎn)的確定方法、裝置及終端
- 一種全局興趣探索推薦方法和裝置
- 信息中心聯(lián)網(wǎng)中的跟蹤排隊(duì)延遲和執(zhí)行相關(guān)的擁塞控制的方法、裝置及介質(zhì)
- 興趣點(diǎn)重要度測量方法和裝置
- 一種導(dǎo)航方法及系統(tǒng)
- 興趣偏好預(yù)測方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種興趣點(diǎn)的質(zhì)量評分獲取方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 聚合興趣點(diǎn)的方法、裝置、設(shè)備和介質(zhì)
- 用于優(yōu)化興趣點(diǎn)標(biāo)簽的方法和裝置





