[發(fā)明專利]多類目標的檢測裝置及檢測方法無效
| 申請?zhí)枺?/td> | 200910168491.X | 申請日: | 2009-08-26 |
| 公開(公告)號: | CN101996326A | 公開(公告)日: | 2011-03-30 |
| 發(fā)明(設計)人: | 梅樹起;吳偉國 | 申請(專利權)人: | 索尼株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張浩;李春暉 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 類目 標的 檢測 裝置 方法 | ||
技術領域
本發(fā)明總體上涉及目標檢測技術,尤其涉及對多類目標的目標數(shù)據(jù)進行檢測的檢測裝置和檢測方法。
背景技術
對圖像中的目標的檢測技術是計算機視覺的一個重要分支。同一類目標受光照、視角、姿態(tài)等多重因素的影響在圖像中可能產生出截然不同的狀態(tài),這給對圖像中的目標的檢測技術帶來很大困難。因此,同一類目標可能會被劃分為多個子類進行處理。然而,類別的增多帶來了計算成本的增加和類別間的區(qū)分問題。如何既能夠高效進行多類目標的檢測而又能準確區(qū)分各類之間的差別仍然是一個需要進一步研究的課題。
對于多類目標檢測問題,文獻【1】提出了一種比較直觀的方案,即,對應多個類別分別訓練多個并行的分類器,并同時使用。這種方案具備良好的性能,但是各類的分類器之間不具備任何關聯(lián),工作時必須全部同時使用。因此,隨著類別數(shù)量的增加,計算成本會線性增加。
文獻【2】提供了一種減少計算成本的方案,即,將多類物體的分類器進行聯(lián)合訓練,在多類之間盡可能共享特征,以達到減少運算成本的目的。文獻【3】提供了另外一種減少計算成本的方案,即,先將多個類別合并為較少的類別訓練分類器,然后逐漸進行類別拆分再訓練分類器。這兩種方案都優(yōu)先使用了多類目標的相似性,而后再考慮各類自己的特性。但是,這兩種方案都沒有顯式地考慮各類之間的差異,因此最終的輸出結果沒有明確的標識。另外,由于多類總是耦合在一起進行訓練和使用,當類別數(shù)量和訓練數(shù)據(jù)數(shù)量特別巨大時,訓練變的十分復雜,而且當類別樣本發(fā)生變化時不得不整體重新訓練所有類別。
參考文獻:
[1]B.Wu,H.Ai,C.Huang,and?S.Lao.Fast?Rotation?InvariantMulti-view?Face?Detection?Based?on?Real?Adaboost,F(xiàn)G?2004.
[2]A.Torralba,K.P.Murphy,and?W.T.Freeman.Sharing?Features:Efficient?Boosting?Procedures?for?Multiclass?Obj?ect?Detection.CVPR2004.
[3]Bo?Wu?and?Ram?Nevatia.Cluster?Boosted?Tree?Classifier?forMulti-View,Multi-Pose?Object?Detection.ICCV?2007.
發(fā)明內容
在下文中給出了關于本發(fā)明的簡要概述,以便提供關于本發(fā)明的某些方面的基本理解。應當理解,這個概述并不是關于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
本發(fā)明的目的是,通過提供一種區(qū)別于上述現(xiàn)有技術的、用于對多個類別的目標數(shù)據(jù)進行檢測的檢測裝置及檢測方法,來至少部分地解決現(xiàn)有技術中存在的上述問題。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種用于對多個類別的目標數(shù)據(jù)進行檢測的檢測裝置的訓練方法,包括:
使用多個目標圖像作為正樣本集,使用與目標圖像的類別不同的多個其它類別的圖像作為負類樣本集,以及使用多個背景圖像作為背景圖像集;
使用正樣本集、負類樣本集和背景圖像集,通過特征遍歷來分別針對用于檢測目標的任務和用于與其它類別的目標進行區(qū)分的任務而確定這兩個任務之間進行特征共享的最優(yōu)特征;
使用所述最優(yōu)特征分別針對用于檢測目標的任務和用于與其它類別的目標進行區(qū)分的任務而構建多個弱分類器,由所構建的針對相同任務的弱分類器相加而得到針對該任務的強分類器,并由所構建的強分類器構成本級的級分類器;以及
通過逐級地構建級分類器而獲得包括多個串聯(lián)的級分類器的級聯(lián)分類器,并由用于輸入待檢測數(shù)據(jù)的輸入單元和所述級聯(lián)分類器構成多類目標的檢測裝置。
根據(jù)本發(fā)明的多類目標的檢測裝置的訓練方法使用正樣本集、負類樣本集和背景圖像集進行訓練,基于正樣本集和背景圖像集來訓練用于執(zhí)行檢測目標的任務的強分類器,并基于負類樣本集來訓練用于執(zhí)行與其它類別的目標進行區(qū)分的任務的強分類器,使得所構建的級聯(lián)分類器能夠同時進行目標檢測和類別區(qū)分,既提高了檢測效率,又大大減小了檢測結果的類別標識模糊性。同時,通過強分類器之間共享特征而不共享弱分類器,保持了不同類別樣本集合之間的差異,避免了降低分類器訓練的收斂速度的風險。
根據(jù)以上訓練方法獲得了多類目標的檢測裝置和檢測方法。
其中,本發(fā)明所提供的一種多類目標的檢測裝置包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼株式會社,未經索尼株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910168491.X/2.html,轉載請聲明來源鉆瓜專利網。





