[發(fā)明專利]具有物體位置偵測功能的裝置及其偵測方法有效
| 申請?zhí)枺?/td> | 201110203505.4 | 申請日: | 2011-07-20 |
| 公開(公告)號: | CN102890822A | 公開(公告)日: | 2013-01-23 |
| 發(fā)明(設(shè)計)人: | 張尹彬;張文彥;周宏隆 | 申請(專利權(quán))人: | 華晶科技股份有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06F3/01;G06F3/042 |
| 代理公司: | 北京北新智誠知識產(chǎn)權(quán)代理有限公司 11100 | 代理人: | 趙郁軍 |
| 地址: | 中國臺灣新竹科*** | 國省代碼: | 中國臺灣;71 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 具有 物體 位置 偵測 功能 裝置 及其 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種影像偵測技術(shù),尤指一種以迭代演算法來快速偵測影像中特定物件的具體位置的影像偵測技術(shù)。
背景技術(shù)
近年來,智慧型影像偵測技術(shù)愈來愈受到重視,其可以應(yīng)用于許多不同的電子產(chǎn)品,例如數(shù)位相機(jī)、體感互動產(chǎn)品以及安全監(jiān)控系統(tǒng)上都可以看到智慧型影像偵測技術(shù)的應(yīng)用。而在這些應(yīng)用中,物體的形狀資訊在影像偵測速度及品質(zhì)上扮演著非常重要的角色。一個好的形狀資訊,即使只是近似形狀大小(Approximated?Shape),都能夠大幅地加快偵測速度及改善偵測品質(zhì)。
一般而言,要估測出影像中特定物件的形狀資訊,可以利用預(yù)設(shè)的顏色資訊逐點地(pixel-by-pixel)比對,并逐漸擴(kuò)大比對的范圍,直到影像中像素的顏色值不符合預(yù)設(shè)的條件為止。在影像分割(Image?Segmentation)的領(lǐng)域中,這類方法常被使用。例如,分水嶺法(WaterShed)及區(qū)域成長法(Region?Growing)等。雖然這類方法在顏色單純的物體上可以提供很不錯的估測效果,但其在計算速度上、顏色連續(xù)性(Connected?Component)上及門檻條件的設(shè)定上則有不少的限制。
然而,為了能夠?qū)︻伾珡?fù)雜的物體進(jìn)行形狀估測,近年來以圖形理論為基礎(chǔ)的方法(Graph-Based?Method)提供了有效的解決方案。例如,Graph-Cut及Normalized?cuts等。雖然上述的方法能夠精確地估測顏色復(fù)雜的物體的形狀,但其計算上也有很高的復(fù)雜度。同樣地,以模形為基礎(chǔ)的方法(Model-Based?Method)也有著相同的問題。例如,主動輪廓法(Active?Contour?Method)。因此,如何加快偵測速度、提高偵測品質(zhì)、解決顏色連續(xù)性的限制、改善因門檻條件不易界定而造成彈性或容錯性不足以及降低對顏色復(fù)雜的物體進(jìn)行估測時計算上的復(fù)雜度即為本發(fā)明所欲解決的問題。
發(fā)明內(nèi)容
有鑒于上述習(xí)知技術(shù)的問題,本發(fā)明的目的在于提供一種具有物體位置偵測功能的裝置及其偵測方法,以解決習(xí)知技術(shù)中偵測速度慢、偵測品質(zhì)差、彈性或容錯性不足、顏色連續(xù)性有限制及對顏色復(fù)雜的物體進(jìn)行估測時,計算復(fù)雜度過高等問題,并使物體位置偵測功能可以被應(yīng)用于計算資源有限的手持行動裝置上,如數(shù)位相機(jī)、手機(jī)等。
為了實現(xiàn)上述目的,本發(fā)明采用了以下技術(shù)方案:
根據(jù)本發(fā)明的目的,提出一種具有物體位置偵測功能的裝置,其特征在于,包括:一影像擷取模組,擷取一影像資料;一權(quán)重分配模組,根據(jù)影像資料中的一待測物體的一可能的初始位置中的一影像及待測物體的一事前資訊(Priori?Knowledge)進(jìn)行一權(quán)重分配,并利用可能的初始位置計算出待測物體的一初始重心;一處理模組,根據(jù)權(quán)重分配所產(chǎn)生的結(jié)果及初始重心進(jìn)行一統(tǒng)計分析,以計算出待測物體的一可能的位置,并求得一重心坐標(biāo),并判斷統(tǒng)計分析的結(jié)果是否符合一預(yù)設(shè)值,若是,則產(chǎn)生一估測結(jié)果;若否,則以所述可能的位置取代可能的初始位置再一次計算待測物體的可能的位置及重心坐標(biāo)。
其中,權(quán)重分配將事前資訊轉(zhuǎn)換成機(jī)率密度函數(shù)(Probability?Density?Function,PDF),并依據(jù)影像資料中的可能的初始位置中的影像中各個像素的顏色值(或邊緣方向值或其結(jié)合)及其在機(jī)率密度函數(shù)之中對應(yīng)值,分別給定各個像素一權(quán)重值。
其中,統(tǒng)計分析利用權(quán)重值,并計算各個像素相對于重心的空間關(guān)系,求得待測物體的一加權(quán)共變矩陣,并對加權(quán)共變矩陣(Weighted?Covariance?Matrix)進(jìn)行特征值分解(Eigen?Decomposition)或奇異值分解(Singular?Value?Decomposition)。
其中,預(yù)設(shè)值為預(yù)設(shè)的精確度、預(yù)設(shè)的迭代次數(shù)或其結(jié)合。
其中,事前資訊包括待測物體的顏色分布資訊、灰階亮度統(tǒng)計圖(Histogram)、邊緣方向梯度統(tǒng)計圖(Edge?Orientation/Gradient?Histogram)或其結(jié)合。
其中,事前資訊由訓(xùn)練資料(Training?Data)、人工指定或分群方法(Clustering)所產(chǎn)生,而待測物體的可能的初始位置由人工指定、分群方法或隨機(jī)采樣符合法(Random?Sample?Consensus,RANSAC)所產(chǎn)生。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華晶科技股份有限公司,未經(jīng)華晶科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110203505.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





