[發(fā)明專利]基于相對梯度的ISA模型的行為識別方法有效
| 申請?zhí)枺?/td> | 201210578578.6 | 申請日: | 2012-12-28 |
| 公開(公告)號: | CN103065158A | 公開(公告)日: | 2013-04-24 |
| 發(fā)明(設(shè)計)人: | 劉啟和;陳雷霆;蔡洪斌;邱航;肖燕霞;周川 | 申請(專利權(quán))人: | 電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 成都中亞專利代理有限公司 51126 | 代理人: | 陳亞石 |
| 地址: | 611731 四川省*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 相對 梯度 isa 模型 行為 識別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及基于相對梯度的ISA模型的行為識別方法。
背景技術(shù)
行為識別是在計算機視覺和模式識別領(lǐng)域備受關(guān)注并具挑戰(zhàn)性的一個研究方向。行為識別任務(wù)不只是實現(xiàn)對人或者虛擬現(xiàn)實中機器人行為的識別,還有比如說對車輛、坦克等的加速、停止、左轉(zhuǎn)、右轉(zhuǎn)等行為的識別等等,在安全監(jiān)控,戰(zhàn)場演習、人機交互,基于行為的視頻檢索等方面有廣泛的應(yīng)用背景。
行為識別是在成功實現(xiàn)視頻圖像序列中的跟蹤,完成特征提取的基礎(chǔ)上進行的,屬于更高一層的視覺任務(wù)。獨立子空間分析(independent?subspace?analysis,?ISA)是一種可以用于特征提取的無監(jiān)督學習模型。獨立子空間分析模型是獨立分量分析(independent?component?analysis,?ICA)模型的一個擴展模型。它是一種能夠有效地模擬人類視覺系統(tǒng)中V1區(qū)簡單細胞與復(fù)雜細胞感受野的響應(yīng)模式的層次化結(jié)構(gòu)模型,并利用ISA對大量的視頻數(shù)據(jù)樣本進行無監(jiān)督學習,獲取具有統(tǒng)計獨立性與稀疏特性的視頻基元,被認為是一種有效的視頻圖像統(tǒng)計分析方法,對于提取視頻中的局部特征也是一種很有效的方法。
公開號為CN?101334845?A的專利公開了一種基于軌跡序列分析和規(guī)則歸納的視頻行為識別方法,該專利主要是解決了固定攝像機場景中利用計算機自動學習頻繁發(fā)生的運動事件規(guī)則,并對感興趣的行為進行自動識別的問題,主要用于智能監(jiān)控。但是如果要檢測的視頻中不是固定攝像機拍攝的,場景信息比較多,對場景進行分割,需要花費一定的時間;或者如果要檢測的視頻中行為模式比較復(fù)雜,采用隱馬爾科夫模型(HMM)進行建模,高效性可能就會降低。
公開號為CN?102306301?A的專利申請文件雖然解決了現(xiàn)有的仿生模型目標識別速度低的問題。但它仍然存在許多不足的地方,比如只考慮了視覺皮層V1中復(fù)雜細胞的基本屬性,而其他特性如環(huán)繞抑制等沒有考慮。
對基于視覺的行為識別而言,從視頻圖像序列中抽取出能夠合理表示視頻中實體的行為數(shù)據(jù)至關(guān)重要。目前人的行為表示方法根據(jù)特征提取方法不同分為基于表觀的表示方法和基于人體模型的表示方法?;诒碛^的表示方法不是對人體物理結(jié)構(gòu)直接建模,而是直接計算感興趣區(qū)域的簡單2D表觀表示,如從視頻圖像序列中提取人的運動軌跡信息、人的輪廓特征或者直接利用圖像信息進行分析。如前述現(xiàn)有技術(shù)一(公開號:CN?101334845?A)、技術(shù)二(公開號:CN?102306301?A)就是基于表觀的表示方法,這類表示方法容易計算,易于實時。人體模型主要有三種:線圖模型、2D模型和3D模型,其中3D模型由于復(fù)雜度較高,很少用于人的行為識別中。雖然基于人體模型的表示方法可以提高行為識別的準確度,但是它的計算量大、復(fù)雜度很高和算法魯棒性差。
發(fā)明內(nèi)容
鑒于上述不足之處,本發(fā)明的目的在于提供一種基于相對梯度的ISA模型的行為識別方法,該方法采用改進的獨立子空間分析算法來提取視頻的局部特征;接著對所提取的局部特征進行聚類,得到聚類中心(即視覺關(guān)鍵詞),對每個視頻,建立視覺關(guān)鍵詞直方圖,則每個視頻表示為基于視覺關(guān)鍵詞直方圖的特征向量;最后就是采用多類別支持向量機SVM對其進行分類,完成對行為的識別。本發(fā)明可以用于個體行為識別,也可以用于群體行為識別。本發(fā)明為一種基于相對梯度的算法,不需要求逆過程,收斂速度更快。
為了達到上述目的,本發(fā)明采用了以下技術(shù)方案:
一種基于相對梯度的ISA模型的行為識別方法,其特征在于:該行為識別方法包括以下步驟:
步驟1:樣本數(shù)據(jù)的預(yù)處理;
步驟2:特征提??;
步驟3:特征聚類;
步驟4:分類/識別。
具體為:
步驟1:樣本數(shù)據(jù)的預(yù)處理。
步驟1.1??首先,采集大量具有視覺行為模式的視頻集合,假設(shè)選取N個視頻樣本進行采樣。
步驟1.2??然后,把每個視頻樣本隨機地分割為num_patches個視頻塊,每個視頻塊的大小為?sp_size×sp_size×tp_size,將分割的所有視頻塊組成一個樣本矩陣X,表示成:X={x1,x2,…,xN*num_patches},其中N是視頻樣本的個數(shù),num_patches表示對每個視頻分割的視頻塊的數(shù)量,每一列向量表示一個視頻塊數(shù)據(jù),維數(shù)為sp_size2×tp_size。
步驟1.3??最后,對步驟1.2得到的樣本矩陣X進行特征中心化、數(shù)據(jù)白化的處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學,未經(jīng)電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210578578.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





