[發(fā)明專利]低分辨率圖像處理中的頭部姿態(tài)估計的方法無效
| 申請?zhí)枺?/td> | 201010259542.2 | 申請日: | 2010-08-21 |
| 公開(公告)號: | CN101908153A | 公開(公告)日: | 2010-12-08 |
| 發(fā)明(設(shè)計)人: | 張鳴;孫兵;李科;劉允才 | 申請(專利權(quán))人: | 上海交通大學(xué) |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 上海交達專利事務(wù)所 31201 | 代理人: | 王錫麟;王桂忠 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分辨率 圖像 處理 中的 頭部 姿態(tài) 估計 方法 | ||
1.一種低分辨率圖像處理中的頭部姿態(tài)估計的方法,其特征在于,根據(jù)訓(xùn)練視頻及其已知的頭部姿態(tài),提取視頻中的訓(xùn)練圖像塊,訓(xùn)練一個用于估計頭部姿態(tài)的霍夫森林;霍夫森林是一個二叉分類樹,訓(xùn)練的結(jié)果是使得在樹的每一個葉子節(jié)點中所包含的訓(xùn)練數(shù)據(jù)的不確定性最??;在完成訓(xùn)練過程后,對輸入圖像幀進行頭部姿態(tài)估計;利用霍夫森林對輸入圖像中的圖像分塊分類到一個葉子節(jié)點,再基于子節(jié)點中保存的訓(xùn)練數(shù)據(jù)在頭部姿態(tài)空間中投票,最后累計投票結(jié)果,將得到投票最多的值作為姿態(tài)估計結(jié)果。
2.根據(jù)權(quán)利要求1所述的低分辨率圖像處理中的頭部姿態(tài)估計的方法,其特征是,包括以下步驟:
①.提取訓(xùn)練圖像塊:提取作為訓(xùn)練數(shù)據(jù)給出的圖像,提取其中人體部分的圖像塊,其中對應(yīng)頭部位置的圖像塊為訓(xùn)練的正樣本,其余位置的為負樣本,同時記錄其對應(yīng)的姿態(tài)真值;
②.計算訓(xùn)練圖像塊的圖像特征,包括:像素的Lab值、一階及二階梯度值和梯度方向直方圖;
③.訓(xùn)練霍夫森林,等價于建立輸入圖像塊的高維特征空間的一個劃分,訓(xùn)練的目的是使得每一個劃分中的訓(xùn)練樣本對應(yīng)的姿態(tài)真值的不確定性最??;
④.提取測試圖像中的圖像塊并提取特征;
⑤.利用霍夫森林投票估計頭部姿態(tài),首先利用霍夫森林對測試圖像中的圖像塊進行分類,對于每一個圖像塊達到的葉子節(jié)點,基于其中保存的訓(xùn)練數(shù)據(jù)對頭部姿態(tài)投票,投票最多的值作為頭部姿態(tài)估計結(jié)果。
3.根據(jù)權(quán)利要求1或者2所述的低分辨率圖像處理中的頭部姿態(tài)估計的方法,其特征是,所述的訓(xùn)練圖像塊,是指給定訓(xùn)練視頻后,首先根據(jù)背景減除的結(jié)果大致定位在每一幀中的人體位置,確定頭部定位方框,然后在人體所在的方框中提取圖像塊,其中頭部方框內(nèi)的圖像塊作為正樣本,而頭部以外位置的樣本作為負樣本,其中對于正樣本,根據(jù)動作捕捉數(shù)據(jù)記錄下該樣本中心點相對于頭部的位置,同時記錄頭部的朝向。
4.根據(jù)權(quán)利要求1或者2所述的低分辨率圖像處理中的頭部姿態(tài)估計的方法,其特征是,所述的訓(xùn)練圖像塊的圖像特征為:首先將原彩色圖片由RGB空間轉(zhuǎn)換到Lab空間,因為Lab空間更加符合人眼對色彩的感知,其中L為亮度通道而ab為兩個色彩通道;每個像素在Lab通道上的三個值構(gòu)成了最后的特征空間的前三個維度;其次分別在x、y方向上對原圖像的灰度圖求一階和二階梯度,通過與x、y方向的sobel算子在圖像平面上卷積得到,這四個值為特征空間的4~7維度;最后的12個維度是以該點為中心的圖像塊的梯度方向直方圖;圖像塊中每一點的梯度方向被分為12個類,再根據(jù)梯度值的大小累加這12個類的方向強度;所得到的梯度方向密度被實踐證明有很好的分類效果;于是,對于步驟1中提取出的每一個圖像塊中的每一個像素點,一共可以計算出19個維度的特征。
5.根據(jù)權(quán)利要求1或者2所述的低分辨率圖像處理中的頭部姿態(tài)估計的方法,其特征是,所述的霍夫森林,其本質(zhì)上是一系列的二叉分類樹,樣本在經(jīng)過一個測試節(jié)點時,會根據(jù)樣本的圖像特征值進行一個測試,當(dāng)結(jié)果為真時,該樣本進入該測試節(jié)點的左邊的子節(jié)點,反之則進入右邊的子節(jié)點。
6.根據(jù)權(quán)利要求1或者2所述的低分辨率圖像處理中的頭部姿態(tài)估計的方法,其特征是,所述的圖像塊為對于每一幀測試圖像,人體的大致位置依然能夠根據(jù)背景減除來估計,并確定一個方框,在方框中選取圖像塊。
7.根據(jù)權(quán)利要求1或者2所述的低分辨率圖像處理中的頭部姿態(tài)估計的方法,其特征是,所述的提取特征是指計算每個圖像塊在Lab空間的表示、一階及二階梯度和梯度方向直方圖特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010259542.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





