[發(fā)明專利]基于在線機(jī)器學(xué)習(xí)的視覺人手跟蹤方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201310385425.4 | 申請(qǐng)日: | 2013-08-29 |
| 公開(公告)號(hào): | CN103426008A | 公開(公告)日: | 2013-12-04 |
| 發(fā)明(設(shè)計(jì))人: | 劉宏;劉星;王燦 | 申請(qǐng)(專利權(quán))人: | 北京大學(xué)深圳研究生院 |
| 主分類號(hào): | G06K9/66 | 分類號(hào): | G06K9/66 |
| 代理公司: | 北京君尚知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11200 | 代理人: | 余長江 |
| 地址: | 518055 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 在線 機(jī)器 學(xué)習(xí) 視覺 人手 跟蹤 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域:
本發(fā)明屬于視覺目標(biāo)跟蹤和智能人機(jī)交互領(lǐng)域,具體涉及一種魯棒的基于在線機(jī)器學(xué)習(xí)的視覺人手跟蹤方法及系統(tǒng)。
背景技術(shù):
基于視覺的人手跟蹤技術(shù)是一門融合了圖像處理、模式識(shí)別、人工智能等許多領(lǐng)域的關(guān)鍵技術(shù)。視覺人手跟蹤技術(shù)有著十分廣泛的應(yīng)用,例如視頻監(jiān)控、智能電視、機(jī)器人控制、視覺游戲等需要人機(jī)交互的領(lǐng)域。由于人手跟蹤技術(shù)有著巨大的應(yīng)用前景,在國際和國內(nèi)對(duì)視覺人手跟蹤的研究方興未艾。
在人機(jī)交互環(huán)境下,人手跟蹤技術(shù)受到了很多挑戰(zhàn)。比如受日光和燈光的影響,光線變化較大;背景中靜態(tài)干擾物和動(dòng)態(tài)干擾物形態(tài)各異且運(yùn)動(dòng)方式無法預(yù)測(cè);人手與環(huán)境中其他物體之間的相互運(yùn)動(dòng)較為復(fù)雜,且容易受到遮擋。面對(duì)這些困難,如何實(shí)現(xiàn)穩(wěn)定的人手跟蹤,從而進(jìn)行更智能和穩(wěn)定的人機(jī)交互,具有著重要的意義。
目前基于視覺的人手跟蹤技術(shù)大致可以分為基于外觀的方法和基于模型的方法。基于外觀的方法首先從圖像中提取特征,與人手具有的特定特征進(jìn)行匹配,在這些基于外觀的方法中光流法、均值漂移法、最大穩(wěn)定極值區(qū)域法是最為常見的方法。而基于模型的方法主要利用人手的3D或2D模型對(duì)人手的特征進(jìn)行估計(jì),并與觀測(cè)到的特征進(jìn)行匹配,例如粒子濾波、3D幾何人手模型、圖模型等。在這些方法中,魯棒性都依賴于對(duì)特定環(huán)境中的多特征融合,缺乏可靠的理論基礎(chǔ)?;谀P偷姆椒ㄔ谒俣壬嫌兄^大的缺陷,而外觀的方法在準(zhǔn)確性上有著明顯的不足。
近年來機(jī)器學(xué)習(xí)在機(jī)器視覺領(lǐng)域得到了廣泛的研究?;诜诸惼鞯哪繕?biāo)檢測(cè)方法為目標(biāo)跟蹤提供了更高的魯棒性。但是單純的目標(biāo)檢測(cè)對(duì)于簡(jiǎn)單的外觀變化如光照變化、快速運(yùn)動(dòng)等卻缺乏魯棒性。如何結(jié)合目標(biāo)檢測(cè)和目標(biāo)跟蹤的優(yōu)點(diǎn)來達(dá)到更高的魯棒性具有重要的理論研究和應(yīng)用意義。
發(fā)明內(nèi)容:
針對(duì)現(xiàn)有技術(shù)中存在的技術(shù)問題,本發(fā)明的目的在于提供一種基于在線機(jī)器學(xué)習(xí)的視覺人手跟蹤方法。本發(fā)明通過在線學(xué)習(xí)將基于分類器的檢測(cè)和基于運(yùn)動(dòng)連續(xù)性的跟蹤結(jié)合起來,以實(shí)現(xiàn)對(duì)現(xiàn)實(shí)應(yīng)用場(chǎng)景魯棒的人手跟蹤。通過利用層級(jí)分類器(檢測(cè)器)對(duì)搜索區(qū)域內(nèi)的像素點(diǎn)進(jìn)行分類,得到對(duì)目標(biāo)的保守但穩(wěn)定的估計(jì);利用結(jié)合鳥群算法的光流法跟蹤器對(duì)目標(biāo)進(jìn)行適應(yīng)性較強(qiáng)但不太穩(wěn)定的估計(jì);利用在線學(xué)習(xí)機(jī)制將二者結(jié)合得到的跟蹤結(jié)果,并且根據(jù)時(shí)間空間約束產(chǎn)生新的樣本來在線更新層級(jí)的分類器,從而實(shí)現(xiàn)跟蹤器和檢測(cè)器的互補(bǔ),來獲得更加魯棒的跟蹤結(jié)果。
本發(fā)明的技術(shù)方案如下:一種基于在線機(jī)器學(xué)習(xí)的視覺人手跟蹤方法,其步驟為:
1)對(duì)視覺數(shù)據(jù)輸入圖像,提取得到圖像特征并檢測(cè)初始人手目標(biāo)位置得到正負(fù)樣本,對(duì)所述正負(fù)樣本進(jìn)行訓(xùn)練得到初始化的分類器;同時(shí)在所述分類器中增加膚色約束;
2)對(duì)后續(xù)采集的視覺數(shù)據(jù)輸入圖像,選取待跟蹤物體的特征點(diǎn),使用基于鳥群算法的光流跟蹤法跟蹤所述特征點(diǎn)確定搜索窗口,得到物體跟蹤器;
3)所述物體跟蹤器在搜索窗口中對(duì)物體的特征點(diǎn)進(jìn)行跟蹤,根據(jù)特征點(diǎn)集估計(jì)物體位置得到目標(biāo)跟蹤物體的置信度,所述分類器對(duì)置信度不可靠的物體進(jìn)行檢測(cè),輸出更新后的物體目標(biāo)中心和窗口;
4)根據(jù)物體目標(biāo)中心和窗口在所述分類器中通過時(shí)間、空間、膚色約束條件產(chǎn)生正負(fù)樣本訓(xùn)練集,重新訓(xùn)練在線機(jī)器學(xué)習(xí)的分類器,更新分類器的參數(shù),用于下一幀的跟蹤。
更進(jìn)一步,所述步驟2)中基于鳥群算法的光流跟蹤法按照如下方法跟蹤所述特征點(diǎn):
1)輸入物體目標(biāo)位置以及搜索窗口,并通過柵格法隨機(jī)產(chǎn)生特征點(diǎn)集;
2)通過LK光流法跟蹤器跟蹤選取的特征點(diǎn),得到跟蹤成功特征點(diǎn)集以及跟蹤失敗特征點(diǎn)集,從特征點(diǎn)集中剔除掉跟蹤失敗的特征點(diǎn);
3)判斷跟蹤特征點(diǎn)的偏離,判斷是否補(bǔ)充特征點(diǎn),并根據(jù)膚色檢測(cè)機(jī)制,在跟蹤目標(biāo)中選取膚色點(diǎn)補(bǔ)充到特征點(diǎn)集中;
4)將滿足約束的特征點(diǎn)加入到特征點(diǎn)集中,繼續(xù)進(jìn)行跟蹤;
5)通過跟蹤成功的特征點(diǎn)集對(duì)目標(biāo)窗口以及中心位置進(jìn)行估計(jì),輸出跟蹤目標(biāo)窗口以及中心位置。
更進(jìn)一步,所述鳥群算法對(duì)特征點(diǎn)之間需要滿足的關(guān)系約束如下:
MINDist<|pi-pj|,MAXDist>|pj-m|,m=median(F),任何兩個(gè)特征點(diǎn)pi、pj的最大距離不超過特征點(diǎn)之間的最大距離MAXDist,最小距離不小于特征點(diǎn)之間的最小距離MINDist,m是中間點(diǎn);所述膚色點(diǎn)的RGB值根據(jù)跟蹤需要設(shè)定。
更進(jìn)一步,所述分類器為P-N在線學(xué)習(xí)分類器。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué)深圳研究生院,未經(jīng)北京大學(xué)深圳研究生院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310385425.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于呈現(xiàn)在線實(shí)體在線狀態(tài)的系統(tǒng)和方法
- 提供web服務(wù)接入的在線系統(tǒng)和方法
- 定制在線圖標(biāo)
- 一種水質(zhì)在線檢測(cè)預(yù)處理裝置
- 在線測(cè)試學(xué)習(xí)方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種在線文檔的分頁方法、裝置、設(shè)備以及可讀介質(zhì)
- 一種基于web在線學(xué)習(xí)的資源訪問平臺(tái)
- 一種在線學(xué)習(xí)系統(tǒng)
- 在線文檔提交方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 空調(diào)冷媒量確定方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì)
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





