[發(fā)明專利]一種基于深度相機(jī)和3D卷積神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法有效
| 申請?zhí)枺?/td> | 201710112825.6 | 申請日: | 2017-02-28 |
| 公開(公告)號: | CN107103277B | 公開(公告)日: | 2020-11-06 |
| 發(fā)明(設(shè)計(jì))人: | 王海濱;馬勝濤 | 申請(專利權(quán))人: | 中科唯實(shí)科技(北京)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 北京律恒立業(yè)知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11416 | 代理人: | 顧珊;龐立巖 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 相機(jī) 卷積 神經(jīng)網(wǎng)絡(luò) 步態(tài) 識別 方法 | ||
本發(fā)明提供了一種基于深度相機(jī)和3D卷積神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法,其特征在于,包括步驟:a)利用深度相機(jī)采集行人步態(tài)的RGB?D圖像序列;b)獲取每幀圖像的步態(tài)剪影以及剪影對應(yīng)的深度圖像剪影;c)將每幀剪影圖像和深度圖像剪影組成雙通道的步態(tài)圖像;d)歸一化步態(tài)圖像序列;e)將步態(tài)圖像序列輸入3D卷積神經(jīng)網(wǎng)絡(luò),前向傳播并輸出識別結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明是一種基于深度相機(jī)和3D卷積神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法,涉及圖像處理、模式識別、深度傳感器、深度學(xué)習(xí)等技術(shù)領(lǐng)域。
背景技術(shù)
步態(tài)識別是一種生物特征識別技術(shù),能夠根據(jù)視頻序列中行人走路的姿態(tài)識別行人身份;與傳統(tǒng)的指紋、人臉、虹膜等生物識別技術(shù)相比,具有非接觸識別、易于隱藏,采集方便等優(yōu)勢,尤其適用于遠(yuǎn)距離場景下的目標(biāo)識別任務(wù)。深度相機(jī)是一種能夠同時記錄RGB圖像和深度圖像的傳感器,與傳統(tǒng)相機(jī)相比,能夠?yàn)槟繕?biāo)識別任務(wù)提供更豐富、更立體的圖像信息。卷積神經(jīng)網(wǎng)絡(luò)是一種常用的深度學(xué)習(xí)框架,隨著深度學(xué)習(xí)在圖像處理和模式識別方面的應(yīng)用,卷積神經(jīng)網(wǎng)絡(luò)的研究和應(yīng)用也越來越受到人們的重視,傳統(tǒng)的2D卷積神經(jīng)網(wǎng)絡(luò)是以圖像為輸入數(shù)據(jù),提取圖像數(shù)據(jù)的空間分布特征,3D卷積神經(jīng)網(wǎng)絡(luò)是以連續(xù)的圖像序列或視頻序列為輸入,能夠同時提取輸入數(shù)據(jù)在時間和空間的分布特征。深度相機(jī)和3D卷積神經(jīng)網(wǎng)絡(luò)結(jié)合應(yīng)用將會顯著提高步態(tài)識別的準(zhǔn)確率。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供了一種基于深度相機(jī)和3D卷積神經(jīng)網(wǎng)絡(luò)的步態(tài)識別方法,其特征在于,包括步驟:a)利用深度相機(jī)采集行人步態(tài)的RGB-D圖像序列;b)獲取每幀圖像的步態(tài)剪影以及剪影對應(yīng)的深度圖像剪影;c)將每幀剪影圖像和深度圖像剪影組成雙通道的步態(tài)圖像;d)歸一化步態(tài)圖像序列;e)將步態(tài)圖像序列輸入3D卷積神經(jīng)網(wǎng)絡(luò),前向傳播并輸出識別結(jié)果。
優(yōu)選地,所述步驟d的具體步驟為:
d1)定位步態(tài)剪影的最上和最下像素點(diǎn),從而計(jì)算步態(tài)剪影的高度h0;
d2)定位步態(tài)剪影的最左和最右像素點(diǎn),從而計(jì)算步態(tài)剪影的寬度w0;
d3)根據(jù)步態(tài)剪影的高度和寬度,計(jì)算剪影的質(zhì)心位置;
d4)給定一個縱橫比r,以質(zhì)心為中心,用w0×h0的矩形裁剪步態(tài)圖像,其中w0=h0*r;
d5)將已裁剪的步態(tài)圖像等比例縮放到3D卷積神經(jīng)網(wǎng)絡(luò)的輸入尺寸;
d6)根據(jù)時間順序?qū)⒉綉B(tài)圖像重組成步態(tài)序列I1,其維度為wi×hi×ci×m,w1,h1,c1,m1分別為I1的寬度,高度,通道數(shù)和序列幀數(shù)。
優(yōu)選地,所述步驟e中3D卷積神經(jīng)網(wǎng)絡(luò)前向傳播的步驟為:
e1)第一組3D卷積層,對步驟d)所得的圖像序列進(jìn)行3D卷積操作,卷積核大小為kw1×kh1×km1,步長為ks1,卷積核個數(shù)為kn1;其卷積輸出為
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中科唯實(shí)科技(北京)有限公司,未經(jīng)中科唯實(shí)科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710112825.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種基于多相機(jī)的產(chǎn)品全方位觀察和測量方法及裝置
- 一種基于多相機(jī)的產(chǎn)品全方位觀察和測量裝置
- 車載相機(jī)校正裝置、圖像生成裝置、車載相機(jī)校正方法、圖像生成方法
- 帶有3D特征圖像的測試裝置
- 雙目相機(jī)
- 一種相機(jī)同步方法及裝置、雙目相機(jī)
- kinect深度相機(jī)與熱紅外相機(jī)的信息融合方法
- 一種應(yīng)用于OCT光譜儀相機(jī)的對中調(diào)節(jié)裝置及其工作方法
- 一種應(yīng)用于OCT光譜儀相機(jī)的對中調(diào)節(jié)裝置
- 監(jiān)控相機(jī)的聯(lián)動方法及系統(tǒng)
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)





