[發(fā)明專利]基于連續(xù)度的多尺度高分辨圖像目標(biāo)檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201210000364.0 | 申請(qǐng)日: | 2012-01-02 |
| 公開(公告)號(hào): | CN102722712A | 公開(公告)日: | 2012-10-10 |
| 發(fā)明(設(shè)計(jì))人: | 焦李成;王爽;高婷;白靜;霍麗娜;劉芳 | 申請(qǐng)(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 王品華;朱紅星 |
| 地址: | 710071*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 連續(xù) 尺度 分辨 圖像 目標(biāo) 檢測(cè) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,涉及圖像分割以及分類,可用于自然圖像中各種大尺度高分辨復(fù)雜背景場(chǎng)景中的目標(biāo)檢測(cè)與定位。?
背景技術(shù)
隨著計(jì)算機(jī)技術(shù)的發(fā)展和計(jì)算機(jī)視覺原理的廣泛應(yīng)用,利用計(jì)算機(jī)圖像處理技術(shù)對(duì)目標(biāo)進(jìn)行實(shí)時(shí)跟蹤研究越來越熱門,目標(biāo)的檢測(cè)定位在智能化交通系統(tǒng)、智能監(jiān)控系統(tǒng)、軍事目標(biāo)檢測(cè)及醫(yī)學(xué)導(dǎo)航手術(shù)中手術(shù)器械定位等方面具有廣泛的應(yīng)用價(jià)值。?
目標(biāo)檢測(cè),是一種基于目標(biāo)幾何和統(tǒng)計(jì)特征的圖像分割,它將目標(biāo)的分割和識(shí)別合二為一,其準(zhǔn)確性和實(shí)時(shí)性是整個(gè)系統(tǒng)的一項(xiàng)重要能力。尤其是在復(fù)雜場(chǎng)景中,需要對(duì)多個(gè)目標(biāo)進(jìn)行實(shí)時(shí)處理時(shí),目標(biāo)自動(dòng)提取和識(shí)別就顯得特別重要。?
目標(biāo)檢測(cè)主要包括兩個(gè)步驟:特征提取和分類器的訓(xùn)練。?
特征的表征能力將直接影響分類器的性能。常用的特征有:原始灰度特征、Haaris小波特征、形狀描述符特征、Gabor特征、有向梯度直方圖HOG特征、Forstner特征和SIFT特征等。常用的分類器有:基于神經(jīng)網(wǎng)絡(luò)的方法、隱馬爾科夫模型(HMM)、基于Kullback信息理論的方法、基于支持矢量機(jī)SVM的方法、貝葉斯決策方法和基于AdaBoost的方法。?
比較經(jīng)典的目標(biāo)檢測(cè)算法是利用HOG算子提取特征,AdaBoost訓(xùn)練分類器的目標(biāo)檢測(cè)框架。在背景中存在干擾邊緣時(shí),HOG特征表現(xiàn)的比較差,會(huì)出現(xiàn)把一些背景中的特征判斷為目標(biāo)特征的情況,因此檢測(cè)的虛警率較高。AdaBoost是一種具有自適應(yīng)性的Boosting算法,它通過建立多學(xué)習(xí)機(jī)組合使得弱學(xué)習(xí)機(jī)的性能得到提升,由于其獨(dú)有的對(duì)學(xué)習(xí)機(jī)性能的自適應(yīng)和對(duì)過學(xué)習(xí)現(xiàn)象的免疫性,近年來引起了廣泛的關(guān)注。但是這種方法同樣還存在一些缺陷,HOG算子結(jié)合AdaBoost的方法需要對(duì)大量未知的特征進(jìn)行訓(xùn)練得到最終的分類器,整個(gè)過程需要對(duì)海量數(shù)據(jù)進(jìn)行處理分析,計(jì)算復(fù)雜度與時(shí)間復(fù)雜度都非常高。?
后來有些學(xué)者研究了人眼視覺成像的機(jī)理,人眼在識(shí)別目標(biāo)時(shí),是將目標(biāo)分解為?多個(gè)組件,根據(jù)人眼檢測(cè)到的許多目標(biāo)組件,結(jié)合目標(biāo)組件的空間結(jié)構(gòu)分布,識(shí)別目標(biāo)。對(duì)于某種目標(biāo)來說,僅僅需要幾個(gè)關(guān)鍵的部件,聯(lián)合部件的空間關(guān)系,就可以用來表征這個(gè)目標(biāo),形成了最初基于稀疏的目標(biāo)檢測(cè)原理。Shivani?Agarwal和Dan?Roth最早提出了基于稀疏表示的目標(biāo)檢測(cè)方法,在該目標(biāo)檢測(cè)框架中,采用了Forstner算子提取目標(biāo)關(guān)鍵特征,采用稀疏神經(jīng)網(wǎng)絡(luò)框架(Sparse?Network?of?Winnow,SNOW)框架進(jìn)行分類器的訓(xùn)練。該框架可以使用極少數(shù)的特征來進(jìn)行目標(biāo)的表征,通過對(duì)這些極少數(shù)特征的訓(xùn)練,來得到一個(gè)可以用于對(duì)一個(gè)窗口進(jìn)行判決的分類器。對(duì)一幅待檢測(cè)圖像進(jìn)行尺度縮放、滑窗掃描,利用得到的分類器實(shí)現(xiàn)圖像中的目標(biāo)檢測(cè)。?
經(jīng)實(shí)驗(yàn)驗(yàn)證,該算法對(duì)于小尺度、低分辨率圖像中的目標(biāo)檢測(cè)具有較高的準(zhǔn)確率與較低的虛警率。但是對(duì)于大尺度、高分辨率的圖像,該算法具有較高的虛警率,并且對(duì)于大尺度的圖像,進(jìn)行多尺度縮放以及在每個(gè)尺度上滑窗掃描,是一個(gè)非常耗時(shí)的過程。?
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)上述已有技術(shù)的不足,提出一種基于連續(xù)度的多尺度高分辨圖像目標(biāo)檢測(cè)方法,以有效降低復(fù)雜背景中的虛警,并降低計(jì)算復(fù)雜度,提高目標(biāo)檢測(cè)的準(zhǔn)確率與時(shí)效性。?
實(shí)現(xiàn)本發(fā)明目的的技術(shù)原理是:利用Forstner算子提取目標(biāo)特征,采用稀疏神經(jīng)網(wǎng)絡(luò)框架SNOW進(jìn)行分類器的訓(xùn)練,對(duì)輸入的待檢測(cè)圖像,提取基于突變的感興趣區(qū)域,并對(duì)感興趣區(qū)域進(jìn)行多尺度縮放,得到基于連續(xù)度的目標(biāo)檢測(cè)結(jié)果,具體步驟包括如下:?
1.一種基于連續(xù)度的目標(biāo)檢測(cè)方法,包括如下步驟:?
(1)從網(wǎng)絡(luò)或視頻中獲取大小為100×40的正訓(xùn)練樣本和負(fù)訓(xùn)練樣本,構(gòu)成訓(xùn)練樣本集合;?
(2)從正類訓(xùn)練樣本集中提取基于Forstner算子的像素塊作為正類樣本特征,構(gòu)造正類樣本特征字典,然后對(duì)字典進(jìn)行聚類,得到多類特征子集,并為每一類子集賦予類別標(biāo)記;?
(3)計(jì)算正類樣本特征之間存在的所有空間關(guān)系,該空間關(guān)系包括距離和角度,給每種空間關(guān)系特征分別賦予類別標(biāo)記;?
(4)對(duì)步驟(2)得到的正類樣本特征,利用稀疏神經(jīng)網(wǎng)絡(luò)框架SNOW進(jìn)行訓(xùn)練,?得到分類器;?
(5)輸入任意大小的待檢測(cè)圖像,依次進(jìn)行均值濾波與二值化處理,得到二值圖像;?
(6)從二值圖像中檢測(cè)灰度連續(xù)突變,根據(jù)突變提取感興趣區(qū)域ROI:?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210000364.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





