[發(fā)明專利]一種基于關(guān)鍵幀的多特征融合的人體姿態(tài)識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201210063893.5 | 申請(qǐng)日: | 2012-03-12 |
| 公開(kāi)(公告)號(hào): | CN102682302A | 公開(kāi)(公告)日: | 2012-09-19 |
| 發(fā)明(設(shè)計(jì))人: | 黃鮮萍;鄭莉莉;梁榮華 | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06T7/00 |
| 代理公司: | 杭州天正專利事務(wù)所有限公司 33201 | 代理人: | 王兵;王利強(qiáng) |
| 地址: | 310014 *** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 關(guān)鍵 特征 融合 人體 姿態(tài) 識(shí)別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種人體姿態(tài)識(shí)別方法。?
背景技術(shù)
近幾年來(lái),隨著中國(guó)及其它新興經(jīng)濟(jì)體城鎮(zhèn)化建設(shè)加速,人口流動(dòng)增大的同時(shí)伴隨著城市化所引發(fā)的一系列交通、治安等城市管理問(wèn)題,視頻監(jiān)控越來(lái)越普及,對(duì)視頻監(jiān)控智能化的需求也越來(lái)越高。人們希望通過(guò)智能分析從視頻中提取更多的信息應(yīng)用于人們的生活和工作中的各個(gè)應(yīng)用領(lǐng)域,例如安防監(jiān)控、智能家居、人機(jī)交互、運(yùn)動(dòng)員輔助訓(xùn)練等。安防行業(yè),如銀行、鐵軌、倉(cāng)庫(kù)等場(chǎng)所中,需要自動(dòng)實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的檢測(cè)和跟蹤,及異常報(bào)警情況,從而減少各類損失;在家居安全系統(tǒng)和醫(yī)療監(jiān)護(hù)系統(tǒng)中,能夠及時(shí)檢測(cè)出家中老人或病人是否發(fā)生異常情況;在智能機(jī)器人領(lǐng)域中,希望能夠?qū)σ曨l中人的姿態(tài)、手勢(shì)、語(yǔ)言的分析,與人進(jìn)行交流和互動(dòng);在體育運(yùn)動(dòng)、舞蹈訓(xùn)練等一些運(yùn)動(dòng)訓(xùn)練中,系統(tǒng)能夠分析運(yùn)動(dòng)員的關(guān)節(jié)運(yùn)動(dòng)參數(shù),用于改進(jìn)運(yùn)動(dòng)員的訓(xùn)練方式。?
現(xiàn)有的人體姿態(tài)識(shí)別通常采用兩種方法:模板匹配法和狀態(tài)空間法。模板匹配法是將圖像序列轉(zhuǎn)換為一組靜態(tài)形狀模式,然后在識(shí)別過(guò)程中用預(yù)先存儲(chǔ)的行為標(biāo)本來(lái)解釋圖像序列中人的運(yùn)動(dòng),該算法的優(yōu)點(diǎn)是計(jì)算復(fù)雜度低,實(shí)現(xiàn)簡(jiǎn)單,但是對(duì)行為的時(shí)間間隔敏感,魯棒性差。狀態(tài)空間法用狀態(tài)空間模型定義每個(gè)靜態(tài)姿勢(shì)并作為一個(gè)狀態(tài),這些狀態(tài)之間通過(guò)某種概率聯(lián)系起來(lái),每個(gè)運(yùn)動(dòng)序列可以看作為這些?靜態(tài)姿勢(shì)不同狀態(tài)之間的一次遍歷,并計(jì)算其聯(lián)合概率的過(guò)程,該算法能夠避免對(duì)時(shí)間間隔建模的問(wèn)題,但是需要訓(xùn)練樣本大,計(jì)算復(fù)雜度高。?
關(guān)鍵幀是指在視頻序列中信息量最大、有代表性的一副或多幅圖像,能夠反映一段視頻的內(nèi)容梗概,同時(shí)要盡量做到簡(jiǎn)潔、數(shù)據(jù)量少,因此在視頻分析過(guò)程中提取關(guān)鍵幀進(jìn)行姿態(tài)識(shí)別很大程度的提高視頻分析效率。常用的關(guān)鍵幀提取技術(shù)大致可以分為:基于鏡頭邊界的方法,是將視頻按照?qǐng)鼍胺指畛扇舾蓚€(gè)獨(dú)立鏡頭,取每組鏡頭的第一幀、最后一幀或者中間幀作為關(guān)鍵幀,此算法簡(jiǎn)單、快捷,但未考慮視覺(jué)內(nèi)容的復(fù)雜性,無(wú)法表示內(nèi)容較長(zhǎng)的視頻片段;基于視頻內(nèi)容分析的方法,是利用圖像特征,判斷視頻圖像幀與當(dāng)前幀的特征差異度,差異越大則為關(guān)鍵幀,這類算法對(duì)于不同長(zhǎng)度和內(nèi)容的視頻能得到較好的效果,但對(duì)于鏡頭運(yùn)動(dòng)和視頻內(nèi)容變化較劇烈時(shí),提取的關(guān)鍵幀將會(huì)很不穩(wěn)定;基于運(yùn)動(dòng)分析的方法,這類算法的典型代表有光流法,該類算法的計(jì)算量較大,對(duì)于局部的運(yùn)動(dòng)信息依賴性強(qiáng);基于聚類的方法,該類算法通過(guò)聚類分析,提取聚類中心作為關(guān)鍵幀,其優(yōu)點(diǎn)是能較好地反映視頻內(nèi)容,但其算法復(fù)雜,且穩(wěn)定性差。?
發(fā)明內(nèi)容
為了克服已有的人體姿態(tài)識(shí)別方法的算法復(fù)雜、穩(wěn)定性差、魯棒性差的不足,本發(fā)明提供一種簡(jiǎn)化計(jì)算、穩(wěn)定性良好、魯棒性良好的基于關(guān)鍵幀的多特征融合的人體姿態(tài)識(shí)別方法。?
本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:?
一種基于關(guān)鍵幀的多特征融合的人體姿態(tài)識(shí)別方法,所述人體姿態(tài)識(shí)別方法包括以下步驟:?
(1)對(duì)視頻圖像提取Hu不變矩特征,計(jì)算圖像序列的覆蓋率,提取覆蓋率最高的設(shè)定覆蓋百分?jǐn)?shù)為候選關(guān)鍵幀,然后計(jì)算候選關(guān)鍵幀的失真率,以提取其中最小的失真百分?jǐn)?shù)為關(guān)鍵幀;?
(2)對(duì)關(guān)鍵幀進(jìn)行前景圖像的抽取,得到運(yùn)動(dòng)人體的前景圖像后;?
(3)提取關(guān)鍵幀的特征信息,所述特征信息為六星模型、六星角度和離心率;得到多特征融合的圖像特征向量;?
(4)使用一對(duì)一的訓(xùn)練好的分類模型,所述分類模型為基于SVM的姿態(tài)分類器,對(duì)姿態(tài)進(jìn)行識(shí)別。?
進(jìn)一步,所述步驟(4)中,針對(duì)N類姿態(tài),在任意兩類樣本之間設(shè)計(jì)一個(gè)SVM,因此就需要設(shè)計(jì)N*(N-1)/2個(gè)SVM。?
再進(jìn)一步,所述步驟(4)中,分類模型的訓(xùn)練過(guò)程如下:?
(4.1)首先對(duì)人體的前景圖像進(jìn)行預(yù)處理,對(duì)于不同的行為視頻片段,先對(duì)其進(jìn)行基于碼本的背景訓(xùn)練,通過(guò)視頻序列幀與背景模型的圖像差分,得到運(yùn)動(dòng)人體的前景圖像,并進(jìn)行形態(tài)學(xué)的圖像處理,去除圖像噪聲;?
(4.2)提取包含11種姿態(tài)的訓(xùn)練數(shù)據(jù)的特征,組成標(biāo)準(zhǔn)樣本的特征庫(kù),使用多姿態(tài)融合的方法對(duì)運(yùn)動(dòng)人體進(jìn)行姿態(tài)特征描述,所述11種姿態(tài)分別為行走、小跳躍、大跳躍、側(cè)走、蹲下、彎腰、爬行、俯臥撐、仰臥起坐和坐下;?
(4.3)通過(guò)對(duì)標(biāo)準(zhǔn)樣本的學(xué)習(xí),構(gòu)建基于SVM的多類分類模型;?
(4.4)利用測(cè)試樣本對(duì)模型進(jìn)行驗(yàn)證,如果低于預(yù)計(jì)的正確率則調(diào)整訓(xùn)練樣本,返回到(4.1),直到高于預(yù)計(jì)的正確率,得到訓(xùn)練后的分類模型。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210063893.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 關(guān)鍵詞輸出設(shè)備和關(guān)鍵詞輸出方法
- 標(biāo)有關(guān)鍵點(diǎn)和關(guān)鍵線的人臺(tái)
- 關(guān)鍵詞質(zhì)量度的檢測(cè)方法和裝置
- 關(guān)鍵詞排名的檢測(cè)方法和裝置
- 關(guān)鍵點(diǎn)識(shí)別
- 磁性開(kāi)關(guān)鍵
- 面板開(kāi)關(guān)鍵
- 關(guān)鍵短語(yǔ)提取方法以及關(guān)鍵短語(yǔ)提取系統(tǒng)
- 通信行為檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種長(zhǎng)尾關(guān)鍵詞識(shí)別方法、關(guān)鍵詞搜索方法及計(jì)算機(jī)設(shè)備





