[發明專利]一種多視角動作識別方法有效
| 申請號: | 201410553477.2 | 申請日: | 2014-10-17 |
| 公開(公告)號: | CN104268586B | 公開(公告)日: | 2018-02-06 |
| 發明(設計)人: | 馬華東;傅慧源;張征 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06K9/64 | 分類號: | G06K9/64;G06K9/46;G06T7/00 |
| 代理公司: | 北京東正專利代理事務所(普通合伙)11312 | 代理人: | 劉瑜冬 |
| 地址: | 100088 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視角 動作 識別 方法 | ||
技術領域
本發明屬于計算機視覺技術領域,特別涉及一種多視角動作識別方法。
背景技術
使用攝像機和計算機代替人眼“看”,也就是計算機視覺技術,開始得到了越來越多的關注。該技術通過攝像機攝像以及使用計算機內的預設算法進行運算,可以對圖像、視頻識別,并做進一步的處理,該種技術試圖建立一種從圖像或者視頻中獲取信息并處理的人工智能系統。
而且,隨著視頻監控技術的日益成熟和監控設備的普及,攝像機等監控設備的成本的日益降低,視頻信息的獲得變得更加的容易和方便,同時視頻信息的質量也越來越高。基于此,人體動作識別得到越來越多的關注。特別對于火車站、機場、地鐵、銀行、監獄等一些對安全要求較高的公共場所,一旦有危險可疑行為發生時,若計算機能夠準確地識別并發出警報,對于安保甚至反恐工作有著重要的意義。
人體動作識別往往既需要提取特征來合理的描述人體動作,又需要設計分類器來準確的區分不同的動作。
目前,動作描述方法大致分為三類:基于全局特征的方法、基于局部特征的方法以及多特征融合的方法。基于全局特征的方法,如光流、運動能量圖、運動歷史圖、方向梯度直方圖、時空體等;基于局部特征的方法,如時空興趣點、Harris興趣點、三維尺度不變特征轉換等。
動作識別方法大致分為模板匹配、生成模型、判別模型三類。
模板匹配就是通過計算待識別模板與已知模板的相似度,把相似度最大的已知模板所對應的類別作為識別結果。生成模型基于一個聯合概率函數建立觀察值與類別間的關系,通過訓練得到每個類別的模型參數,然后分別計算待識別動作與每個模型的匹配程度,將最匹配的類別作為識別結果。生成模型主要包括隱馬爾科夫模型、潛在狄利克雷分配模型、概率潛在語義分析模型等。判別模型主要包括支持向量機、條件隨機場等。
模板匹配的優點是算法簡單易實現,時間開銷少,對相差比較大的行為識別效果較好,但對細微差別的行為識別效果較差,對運動持續時間的變化及噪聲比較敏感。
生成模型中,隱馬爾科夫模型被廣泛使用。隱馬爾科夫模型基于兩個假設:輸出獨立性假設和馬爾科夫性假設。由于其輸出獨立性假設要求觀察值序列嚴格相互獨立才能保證推導的正確性,導致其不能考慮上下文的特征,即不能適應存在依賴關系的觀察值序列。而且傳統隱馬爾科夫模型的鏈狀結構能夠為簡單的動作,如走、跑等,進行較好的建模,但對于較為復雜的運動,如交互行為、場景事件等,不能得到很好的結果,所以也無法實現多視角的人體動作識別。
判別模型中,條件隨機場被廣泛使用。條件隨機場對整個觀察值序列進行建模,它使用了一種概率圖模型,具有表達長距離依賴性和交疊性特征的能力,并不在每一個節點進行歸一化,而是所有特征進行全局歸一化,因此可以求得全局的最優值。然而,對于多視角的人體動作存在兩種觀察值序列,一種是單個攝像頭下的時間動作序列,另一種是多個攝像頭之間的空間動作序列,顯然,一維的線性條件隨機場已不能表達多視角的人體動作。
綜上所述,模型匹配對細微差別的行為識別效果差、對運動持續時間的變化及噪聲比較敏感,生成模型不能適應存在依賴關系的觀察值序列且對于較復雜的運動不能得到很好的效果,判別模型只能使用一維的線性條件隨機場,由于上述方法都存在較大的缺陷,所以提供一種對細微差別的行為識別效果強、對運動持續時間的變化及噪聲不敏感、適應存在依賴關系的觀察值序列、對復雜動作識別能力強且能表達多視角的人體動作的方法成為了本領域技術人員一直追求的目標。
發明內容
由于現有技術存在對細微差別的行為識別效果差、對運動持續時間的變化及噪聲比較敏感、適應存在依賴關系的觀察值序列、對于較復雜的運動不能得到很好的效果、只能使用一維的線性條件隨機場的問題,本發明提出了一種多視角動作識別方法。
為實現上述技術目的,本發明具體提供了如下的技術方案:
一種多視角動作識別方法,該方法包括如下步驟:(1)動作訓練過程,通過二維條件隨機場的方法訓練并獲得分類器;(2)動作識別過程,利用步驟(1)獲得的分類器識別動作;
動作識別過程包括如下步驟:
S1:對待識別視頻文件提取時空興趣點;
S2:計算時空興趣點所在區域的特征描述子;
S3:對S2中所有的特征描述子降維;
S4:將S3中降維后的特征描述子聚類,獲得預處理文件;
S5:將S4所得預處理文件送入訓練過程中得到的分類器。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410553477.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于柱塞泵的翻轉工裝
- 下一篇:一種U形內折彎鈑金件夾緊工裝





