[發(fā)明專利]低分辨率圖像處理中的頭部姿態(tài)估計的方法無效
| 申請?zhí)枺?/td> | 201010259542.2 | 申請日: | 2010-08-21 |
| 公開(公告)號: | CN101908153A | 公開(公告)日: | 2010-12-08 |
| 發(fā)明(設(shè)計)人: | 張鳴;孫兵;李科;劉允才 | 申請(專利權(quán))人: | 上海交通大學(xué) |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 上海交達(dá)專利事務(wù)所 31201 | 代理人: | 王錫麟;王桂忠 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分辨率 圖像 處理 中的 頭部 姿態(tài) 估計 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種圖像處理技術(shù)領(lǐng)域的方法,特別是涉及一種低分辨率圖像處理中的頭部姿態(tài)估計的方法。
背景技術(shù)
從圖像中估計人體的三維姿態(tài)一直是很多計算機視覺應(yīng)用如智能監(jiān)控、運動分析、虛擬現(xiàn)實及人機交互中的一個關(guān)鍵問題。當(dāng)給出一幅圖像時,一個理想的系統(tǒng)應(yīng)該能夠同時估計出頭部的位置及朝向(當(dāng)使用“姿態(tài)”一詞時,通常表示位置加上朝向),但是很多已有的方法只能解決其中的一個問題。如常用的頭部跟蹤方法只是估計頭部在圖像上的位置。而通常的頭部姿態(tài)估計方法需要其輸入圖像中的頭部位置已知并且對齊,而且需要較高分辨率的人臉圖像。
常見的頭部跟蹤方法如Condensation及均值漂移,它們均假設(shè)在跟蹤過程中的頭部圖像保持不變或較小的變化,然后用一種類似模板匹配的方式來跟蹤。并且對于這些跟蹤方法,在跟蹤前需要首先指定頭部的初始位置。Wei等人2002年在International?Conference?on?ImageProcessing中的論文Head?pose?estimation?using?gabor?eigenspace?modeling(利用gabor特征空間建模的頭部姿態(tài)估計)提出的方法通過已知姿態(tài)的對齊的臉部訓(xùn)練圖像,將圖像轉(zhuǎn)換到一個二維距離空間,然后當(dāng)給出輸入圖像時,利用最近鄰法得到其姿態(tài)。這種方法需要的輸入數(shù)據(jù)是位置及大小均確定的臉部圖像。因此本領(lǐng)域需要一種能夠同時估計頭部位置及朝向的方法,并且能夠工作在普通相機得到的較低分辨率下。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提出一種低分辨率圖像處理中的頭部姿態(tài)估計的方法,本發(fā)明能夠同時估計頭部位置及朝向,并且能夠在較低分辨率下工作。
本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
本發(fā)明根據(jù)訓(xùn)練視頻及其已知的頭部姿態(tài),提取訓(xùn)練視頻中的圖像塊,訓(xùn)練一個用于估計頭部姿態(tài)的霍夫森林。霍夫森林實際上是一個二叉分類樹,訓(xùn)練的結(jié)果是使得在樹的每一個葉子節(jié)點中所包含的訓(xùn)練數(shù)據(jù)的不確定性最小。在完成訓(xùn)練過程后即可以對輸入圖像幀進(jìn)行頭部姿態(tài)估計。利用霍夫森林對輸入圖像中的圖像分塊分類到一個葉子節(jié)點,再基于子節(jié)點中保存的訓(xùn)練數(shù)據(jù)在頭部姿態(tài)空間中投票,最后累計投票結(jié)果,將得到投票最多的值作為姿態(tài)估計結(jié)果。
本發(fā)明包括以下步驟:
①.提取訓(xùn)練圖像塊:提取作為訓(xùn)練數(shù)據(jù)給出的圖像,提取其中人體部分的圖像塊,其中對應(yīng)頭部位置的圖像塊為訓(xùn)練的正樣本,其余位置的為負(fù)樣本,同時記錄其對應(yīng)的姿態(tài)真值。
②.計算訓(xùn)練圖像塊的圖像特征,包括像素的Lab值、一階及二階梯度值和梯度方向直方圖。
③.訓(xùn)練霍夫森林。訓(xùn)練霍夫森林等價于建立輸入圖像塊的高維特征空間的一個劃分。訓(xùn)練的目的是使得每一個劃分中的訓(xùn)練樣本對應(yīng)的姿態(tài)真值的不確定性最小。
④.提取測試圖像中的圖像塊并提取特征。
⑤.利用霍夫森林投票估計頭部姿態(tài)。首先利用霍夫森林對測試圖像中的圖像塊進(jìn)行分類。對于每一個圖像塊達(dá)到的葉子節(jié)點,基于其中保存的訓(xùn)練數(shù)據(jù)對頭部姿態(tài)投票,投票最多的值作為頭部姿態(tài)估計結(jié)果。
與現(xiàn)有技術(shù)相比,本發(fā)明首先可以適用于低分辨率視頻中的圖像,且可以同時估計圖像中人體頭部的位置和朝向。本發(fā)明適用于從普通相機拍攝的低分辨率視頻圖像中估計其中人體的頭部三維姿態(tài),可用于智能監(jiān)控,運動分析、虛擬現(xiàn)實及高級人機交互等方面。
附圖說明
圖1為實施例視頻中的(a)一幀圖像,(b)及其中對應(yīng)的人體及頭部位置和(c)用于訓(xùn)練分類器的正樣本和負(fù)樣本的范例。
圖2為一個二叉分類樹的示意圖。
圖3為實施例所用視頻中的(a)一幅圖像,(b)(c)兩個圖像塊對于頭部位置的投票結(jié)果及(d)所有投票結(jié)果的和。
圖4為實施例視頻中頭部姿態(tài)估計的結(jié)果。
具體實施方式
以下結(jié)合附圖對本發(fā)明的實施例作詳細(xì)說明:以下實施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行實施,給出了詳細(xì)的實施方式和過程,但本發(fā)明的保護(hù)范圍不限于下述的實施例。
實施例
本實施例選用由某大學(xué)提供的人體運動視頻和其對應(yīng)的動作捕捉數(shù)據(jù)被用于訓(xùn)練和最終結(jié)果評估。其視頻場景的分辨率為640×480,但其中人體頭部的像素高度根據(jù)距離遠(yuǎn)近的變化范圍僅為40~65像素。實施例中所選擇的視頻為二號人物的奔跑動作。
本實施例從該視頻中估計頭部姿態(tài)的方法包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010259542.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





