[發明專利]基于人腦視覺記憶原理的人體動作識別方法及系統有效
| 申請號: | 201510407799.0 | 申請日: | 2015-07-13 |
| 公開(公告)號: | CN105023000B | 公開(公告)日: | 2018-05-01 |
| 發明(設計)人: | 諶先敢;劉海華;高智勇;李旭 | 申請(專利權)人: | 中南民族大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京捷誠信通專利事務所(普通合伙)11221 | 代理人: | 王衛東 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人腦 視覺 記憶 原理 人體 動作 識別 方法 系統 | ||
技術領域
本發明涉及計算機視覺和視頻監控領域,具體是涉及一種基于人腦視覺記憶原理的人體動作識別方法及系統。
背景技術
基于視頻的人體動作識別是一個非常重要的問題,可應用于視頻監控、視頻檢索和人機交互。人體動作識別是指用計算機從視頻序列中區分出人體動作的類別。
基于視頻的人體動作識別可以分為兩個部分:動作的表示和動作的分類。視頻可以分為訓練集合和測試集合。動作的表示是指:從包含人體動作的視頻序列中,提取合適的特征數據,來描述人體的動作。動作的分類是指:通過學習訓練集合中的特征數據,得到分類器模型,將測試集合中的特征數據進行分類。
目前許多視頻或多或少都存在一些遮擋,包括自遮擋或被其他目標遮擋,這會造成執行動作的主體并不是全部可見,難以提取有效的動作特征,給人體動作識別帶來很大的挑戰。
在當前的動作識別方法中,如下幾種方法在遮擋情況下的性能是能夠被接受的:局部方法、基于概率的方法和基于姿勢的方法,但這些方法各有一定的局限性。局部方法所用的興趣點探測,可能錯誤識別不在前景目標中的局部小塊。基于概率的方法,如貝葉斯網絡,隱馬爾可夫模型,是扁平模型,在表示簡單動作方面是有效的,但并不能描述復雜動作中的層次和共享結構。基于姿勢的方法,需要使用探測器,通過手工標注訓練圖像,來訓練每個身體部位,這就限制了基于姿勢的方法在動作識別上的應用。因此,亟待有效的方法來解決人體動作識別中的遮擋問題。
發明內容
本發明的目的是為了克服上述背景技術的不足,提供一種基于人腦視覺記憶原理的人體動作識別方法及系統,能有效解決人體動作識別中的遮擋問題。
本發明提供一種基于人腦視覺記憶原理的人體動作識別方法,包括以下步驟:
A、訓練階段:
A1、采集多個訓練視頻,對每個訓練視頻分別進行密集采樣,將采樣塊上的方向梯度直方圖HOG特征作為局部特征,得到訓練視頻的HOG特征集合;
A2、采用期望最大化算法,對步驟A1得到的訓練視頻的HOG特征集合進行學習,得到一組“超完備”基向量;
A3、結合步驟A2得到的“超完備”基向量,采用稀疏編碼的方式,對步驟A1得到的訓練視頻的HOG特征集合進行特征編碼,得到第一稀疏向量集合,第一稀疏向量集合中每個向量的維度與“超完備”基向量的維度相同,對第一稀疏向量集合中的全部稀疏向量進行求和運算,再進行歸一化,得到一個維度與“超完備”基向量維度相同的向量,作為訓練視頻的編碼結果,用訓練視頻的編碼結果來表達訓練視頻中的人體動作;
A4、將步驟A3得到的所有訓練視頻的編碼結果送入支持向量機SVM分類器進行訓練,生成訓練模型;
A5、使用步驟A3得到的所有訓練視頻的編碼結果,來構建視覺記憶庫,視覺記憶庫中存儲的視頻都未被遮擋;
B、識別階段:
B1、輸入待識別視頻,對待識別視頻進行密集采樣,將采樣塊上的HOG特征作為局部特征,得到待識別視頻的HOG特征集合;
B2、結合步驟A2得到的“超完備”基向量,采用稀疏編碼的方式,對步驟B1得到的待識別視頻的HOG特征集合進行特征編碼,到得第二稀疏向量集合,第二稀疏向量集合中每個向量的維度與“超完備”基向量維度相同,對第二稀疏向量集合中的全部稀疏向量進行求和運算,再進行歸一化,得到一個維度與“超完備”基向量維度相同的稀疏向量;
B3、確定待識別視頻中被遮擋的部位,用視覺記憶庫中的檢索結果替換待識別視頻中被遮擋的部位,得到待識別視頻的編碼結果:
以步驟B2得到的稀疏向量為索引,在步驟A5構建的視覺記憶庫中進行檢索,將檢索出的視頻作為檢索結果,用檢索結果中視頻的局部特征替換待識別視頻中被遮擋部位的特征,得到經過替換后的視頻的HOG特征集合,作為新的局部特征;用步驟A2得到的“超完備”基向量對該新的局部特征進行特征編碼,得到新的稀疏向量,作為待識別視頻的編碼結果,用待識別視頻的編碼結果來表達待識別視頻中的人體動作;
B4、將步驟B3得到的待識別視頻的編碼結果送入步驟A4生成的訓練模型進行測試,得到待識別視頻中的人體動作類別。
在上述技術方案的基礎上,步驟A中,所述對每個訓練視頻分別進行密集采樣的過程為:對于單個訓練視頻,以密集采樣點為中心,找到該訓練視頻的多個局部采樣塊。
在上述技術方案的基礎上,所述局部采樣塊的尺寸為小于訓練視頻尺寸的任意尺寸。
在上述技術方案的基礎上,所述局部采樣塊的尺寸為16×16×4像素。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南民族大學,未經中南民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510407799.0/2.html,轉載請聲明來源鉆瓜專利網。





