[發(fā)明專利]基于迭代二分級(jí)聯(lián)分類器的快速物體檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410145293.2 | 申請(qǐng)日: | 2014-04-11 |
| 公開(公告)號(hào): | CN103942565A | 公開(公告)日: | 2014-07-23 |
| 發(fā)明(設(shè)計(jì))人: | 龐彥偉;曹家樂 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 二分 級(jí)聯(lián) 分類 快速 物體 檢測(cè) 方法 | ||
所屬技術(shù)領(lǐng)域
本發(fā)明涉及人機(jī)交互、計(jì)算機(jī)視覺等領(lǐng)域中快速、高效的物體檢測(cè)方法,特別是涉及采用級(jí)聯(lián)分類器進(jìn)行物體檢測(cè)的方法。
背景技術(shù)
物體檢測(cè)是計(jì)算機(jī)視覺中一個(gè)十分重要的研究領(lǐng)域,包含人臉檢測(cè)、行人檢測(cè)以及車輛檢測(cè)等,可以廣泛地用于人機(jī)交互、視頻監(jiān)控以及圖像檢索等領(lǐng)域。衡量一個(gè)物體檢測(cè)系統(tǒng)好壞的兩個(gè)主要指標(biāo)為:檢測(cè)率和檢測(cè)速度[1]。一般情況而言,檢測(cè)率越高意味著檢測(cè)速度相對(duì)較慢,而檢測(cè)速度越快意味著檢測(cè)率相對(duì)較低。因此,如何權(quán)衡二者的利弊一直是物體檢測(cè)領(lǐng)域一個(gè)不可回避的問題。
近年來,隨著智能手機(jī)、可穿戴式設(shè)備的發(fā)展,基于移動(dòng)設(shè)備的物體檢測(cè)逐漸發(fā)展起來。但是,由于存在計(jì)算能力相對(duì)較弱、電池電量相對(duì)較少等局限,移動(dòng)設(shè)備對(duì)物體檢測(cè)系統(tǒng)的實(shí)時(shí)性提出了更加苛刻地要求。因此,本發(fā)明主要研究如何在保持檢測(cè)率不變的情況下提高檢測(cè)速度。
物體檢測(cè)主要包含特征提取、窗口生成以及分類器判定等三個(gè)方面。其中,分類器判定占據(jù)了物體檢測(cè)大部分時(shí)間。研究人員在基于級(jí)聯(lián)結(jié)構(gòu)的分類器設(shè)計(jì)方面做了許多相關(guān)工作,試圖通過優(yōu)化級(jí)聯(lián)分類器的結(jié)構(gòu)來減少分類器判定的時(shí)間,進(jìn)而加快物體檢測(cè)的速度。
當(dāng)前,大部分已存在級(jí)聯(lián)分類器學(xué)習(xí)方法都屬于基于檢測(cè)率和虛檢率的級(jí)聯(lián)分類器學(xué)習(xí)方法,簡(jiǎn)稱為DF-guided方法。2004年Viola和Jones[2]發(fā)現(xiàn)結(jié)構(gòu)相對(duì)簡(jiǎn)單的Boosted分類器在保證正例窗口全部通過的前提下能夠拒絕大部分的負(fù)例窗口。他們利用這一特性將總檢測(cè)目標(biāo)平均分配給每一級(jí)分類器,即指定每一級(jí)分類器的檢測(cè)率和虛檢率,由此訓(xùn)練得到一個(gè)級(jí)聯(lián)分類器。這種方法被稱為傳統(tǒng)級(jí)聯(lián)分類器學(xué)習(xí)方法。由于前幾級(jí)分類器僅由少量的弱分類器構(gòu)成便能夠提前拒絕大部分的負(fù)例窗口,因此,這種級(jí)聯(lián)結(jié)構(gòu)的分類器大大地加快了物體檢測(cè)的速度。2008年Brubaker等人[3]利用不同級(jí)之間弱分類器之間存在一定冗余這一特性,提出后一級(jí)分類器可利用前一級(jí)分類器的得分繼續(xù)訓(xùn)練得到。這種方法被稱為循環(huán)利用級(jí)聯(lián)分類器方法。由于重復(fù)利用前一級(jí)分類器的信息,相對(duì)于傳統(tǒng)級(jí)聯(lián)分類器,循環(huán)利用級(jí)聯(lián)分類器減少了每一級(jí)分類器中的弱分類器個(gè)數(shù),進(jìn)而進(jìn)一步加快了檢測(cè)速度。2005年Bourdev和Brandt[4]提出了soft-Cascade。該方法訓(xùn)練一級(jí)長(zhǎng)度為T強(qiáng)分類器,并為強(qiáng)分類器中每一個(gè)弱分類器設(shè)定一個(gè)閾值,這樣就形成了一個(gè)長(zhǎng)度為T的級(jí)聯(lián)分類器。若一個(gè)窗口通過前t個(gè)弱分類器的得分之和低于第t個(gè)弱分類器的閾值就會(huì)被立即拒絕。該方法減少級(jí)聯(lián)分類器中弱分類器總數(shù),通過適當(dāng)?shù)脑O(shè)置每一級(jí)弱分類器的閾值能夠在檢測(cè)率基本保持不變的情況下加快檢測(cè)速度。以上幾種方法都是基于如何減少每一級(jí)中弱分類的總數(shù)以及如何更早地拒絕負(fù)例窗口的思想提出的。雖然它們?cè)谝欢ǖ某潭壬咸岣吡藱z測(cè)速度,但是這些方法沒有從根本上解決如何設(shè)定級(jí)聯(lián)分類器的級(jí)數(shù)、如何分配每一級(jí)分類器的檢測(cè)率和虛檢率以及如何最小化計(jì)算消耗量等問題。
相對(duì)于DF-guided方法,近年來,科研人員開始從最小化計(jì)算量的角度出發(fā)設(shè)計(jì)級(jí)聯(lián)分類器。2005年Chen和Yuille[5]從最優(yōu)化總檢測(cè)時(shí)間的角度出發(fā)進(jìn)行弱分類的選擇和級(jí)聯(lián)結(jié)構(gòu)的生成。該方法試探性地設(shè)置一個(gè)較大的總檢測(cè)時(shí)間并由高到低減小該時(shí)間,直到不能夠?qū)⒃摃r(shí)間分配給每一級(jí)為止,此時(shí)形成的級(jí)聯(lián)分類器便是一種快速、高效的級(jí)聯(lián)分類器。該方法將先前的文字檢測(cè)的算法[6]加快了2.5倍。2010年Sabrian和Vasconcelos[7]從傳統(tǒng)級(jí)聯(lián)分類器設(shè)計(jì)的過程沒有考慮速度最優(yōu)以及自動(dòng)設(shè)計(jì)的角度出發(fā),以聯(lián)合最優(yōu)分類誤差和計(jì)算時(shí)間為目標(biāo)函數(shù),在訓(xùn)練過程中不斷迭代增加最能夠優(yōu)化目標(biāo)函數(shù)的弱分類,提出了一種快速級(jí)聯(lián)分類器(即FCBoost)生成方法。該方法在檢測(cè)速度和檢測(cè)性能上較傳統(tǒng)的級(jí)聯(lián)分類器都有了一定的提升。同樣,2012年Chen[8]等人從最優(yōu)化檢測(cè)性能和計(jì)算速度的角度出發(fā),不斷調(diào)整弱分類器先后順序,設(shè)計(jì)了Cronus級(jí)聯(lián)分類器并取得了不錯(cuò)的效果。以上幾種方法都從較低計(jì)算復(fù)雜度的角度出發(fā)進(jìn)行級(jí)聯(lián)分類器的設(shè)計(jì),相對(duì)于DF-guided方法,它們?cè)跈z測(cè)速度和檢測(cè)性能上都取得了不錯(cuò)的效果。但是,大部分方法都存在訓(xùn)練過于復(fù)雜和局部貪婪等問題。
參考文獻(xiàn):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410145293.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種LED芯片級(jí)聯(lián)信號(hào)的單線傳輸方法
- 圖像信號(hào)處理器,圖像信號(hào)處理系統(tǒng)和圖像傳輸級(jí)聯(lián)器
- 一種業(yè)務(wù)管理系統(tǒng)級(jí)聯(lián)操作的處理方法和裝置
- 級(jí)聯(lián)式LED驅(qū)動(dòng)器
- 處理器級(jí)聯(lián)方法和系統(tǒng)
- 一種MCU級(jí)聯(lián)結(jié)構(gòu)及其控制方法和控制系統(tǒng)
- 一種框式設(shè)備內(nèi)部級(jí)聯(lián)口故障檢查方法及裝置
- 刀箱、刀箱級(jí)聯(lián)管理方法及裝置
- 一種級(jí)聯(lián)裝置、籠車及籠車組件
- 一種多功能級(jí)聯(lián)的離線燒錄方法和系統(tǒng)





