[發(fā)明專利]基于四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710471157.6 | 申請(qǐng)日: | 2017-06-20 |
| 公開(kāi)(公告)號(hào): | CN107341452B | 公開(kāi)(公告)日: | 2020-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 孟勃;劉雪君;王曉霖 | 申請(qǐng)(專利權(quán))人: | 東北電力大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 北京金智普華知識(shí)產(chǎn)權(quán)代理有限公司 11401 | 代理人: | 皋吉甫 |
| 地址: | 132012 吉*** | 國(guó)省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 四元數(shù) 時(shí)空 卷積 神經(jīng)網(wǎng)絡(luò) 人體 行為 識(shí)別 方法 | ||
1.一種基于四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別方法,其特征在于,所述方法具體為:
(1)構(gòu)建四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò);
(2)將包含多種人體動(dòng)作的F組彩色圖像表示為四元數(shù)的形式,將其中f組彩色圖像作為訓(xùn)練集,將訓(xùn)練集作為訓(xùn)練樣本輸入所述四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò),并利用BP算法訓(xùn)練訓(xùn)練集樣本,得到訓(xùn)練好的四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò);
(3)將其他F-f組彩色圖像作為樣本輸入訓(xùn)練好的四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò),利用訓(xùn)練好的四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)將彩色圖像分類,實(shí)現(xiàn)人體行為識(shí)別;
所述四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)包括空間卷積層、時(shí)間卷積層、下采樣層、全連接層、長(zhǎng)短時(shí)記憶單元和分類器;樣本經(jīng)空間卷積層、時(shí)間卷積層、下采樣層循環(huán)P次得到樣本的特征圖序列,全連接層將序列中每一個(gè)特征圖都拉伸成一個(gè)特征向量,長(zhǎng)短時(shí)記憶單元將特征向量輸送至分類器,分類器依據(jù)特征向量將樣本分類;
所述四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)包括3P+1層結(jié)構(gòu);
F、f、P均為自然數(shù)。
2.根據(jù)權(quán)利要求1所述基于四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別方法,其特征在于,所述包含多種人體動(dòng)作的F組彩色圖像表示為四元數(shù)的形式為:
彩色圖像Q中(x,y)位置的像素用一個(gè)純四元數(shù)表示,公式如下:
Q(x,y)=Qr(x,y)i+Qg(x,y)j+Qb(x,y)k
或表示為向量的形式:
Q(x,y)=(Qr(x,y),Qg(x,y),Qb(x,y))
其中,Qr(x,y),Qg(x,y)和Qb(x,y)分別為像素的R,G和B通道的值;一張彩色圖像可以表示為:
Q=(Qr,Qg,Qb);
所述四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)的卷積核以四元數(shù)形式。
3.根據(jù)權(quán)利要求1所述基于四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別方法,其特征在于,在步驟(2)和步驟(3)中所述彩色圖像經(jīng)過(guò)預(yù)處理后作為樣本輸入,所述預(yù)處理方法為采用碼本模型,以a×d的檢測(cè)窗口提取圖像中人體運(yùn)動(dòng)的關(guān)鍵區(qū)域,并保存區(qū)域圖像;
檢測(cè)窗口的大小根據(jù)所述彩色圖像中人體的大小進(jìn)行選擇,以在包括人體的條件下盡可能小的尺寸;
a、d為常數(shù)。
4.根據(jù)權(quán)利要求2所述的基于四元數(shù)時(shí)空卷積神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別方法,其特征在于,所述空間卷積層的具體操作為:在四元數(shù)時(shí)空卷積層,卷積核被擴(kuò)展成純四元數(shù)的表示形式W=(Wr,Wg,Wb),按照下式的卷積操作,輸入一張彩色圖像Q=(Qr,Qg,Qb),第i層第j個(gè)特征圖中(x,y)位置的卷積結(jié)果為:
W×Q=(WgQb-WbQg,WbQr-WrQb,WrQg-WgQr)
其中,f是sigmoid函數(shù),bi,j是第i層第j個(gè)特征圖的偏置,是第i層第j個(gè)特征圖和第i-1層第p個(gè)特征圖之間的卷積核的(n,m)位置的權(quán)值向量,N和M是卷積核的長(zhǎng)和寬;Q(i-1),p(x+n,y+m)表示第i-1層第p個(gè)特征圖Q中的(x+n,y+m)位置的像素;Zi,i(x,y)表示第i層第j個(gè)特征圖中(x,y)位置的卷積結(jié)果;
操作是兩個(gè)純四元數(shù)向量元素對(duì)應(yīng)相乘,提取的是每個(gè)通道上的空間特征;×操作是叉積操作,提取的是不同顏色通道的空間關(guān)系。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北電力大學(xué),未經(jīng)東北電力大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710471157.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種基于小變換的指紋特征提取方法
- 下一篇:一種車道線提取方法及裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于四元數(shù)小波和區(qū)域分割的多焦點(diǎn)圖像融合方法
- 基于四元數(shù)指數(shù)矩的彩色圖像水印方法
- 一種人體關(guān)節(jié)角度解算方法及裝置
- 一種基于四元數(shù)廣義判別分析的RGB-D目標(biāo)識(shí)別方法
- 一種基于四元數(shù)的無(wú)人機(jī)姿態(tài)解算方法
- 一種云臺(tái)姿態(tài)調(diào)整方法及裝置
- 基于COLD陣列增強(qiáng)四元數(shù)ESPRIT的DOA估計(jì)方法
- 基于增強(qiáng)四元數(shù)多重信號(hào)分類的到達(dá)角估計(jì)方法
- 拇指與手掌間自由度解算方法、裝置及數(shù)據(jù)手套
- 一種視頻圖像的運(yùn)動(dòng)平滑處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種時(shí)空地理大數(shù)據(jù)的檢索方法及系統(tǒng)
- 一種泛知識(shí)化時(shí)空對(duì)象表達(dá)數(shù)據(jù)庫(kù)建立方法
- 一種基于時(shí)空密度波與同步的大型時(shí)空數(shù)據(jù)聚類算法GRIDWAVE
- 時(shí)空數(shù)據(jù)的存儲(chǔ)方法、查詢方法及存儲(chǔ)裝置、查詢裝置
- 一種云環(huán)境下時(shí)空索引的構(gòu)建方法、裝置及電子設(shè)備
- 面向工業(yè)4.0的時(shí)空大數(shù)據(jù)分布式存儲(chǔ)檢索方法及系統(tǒng)
- 一種數(shù)據(jù)比對(duì)碰撞方法和裝置
- 時(shí)空數(shù)據(jù)的異常檢測(cè)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種可直接捕獲時(shí)空相關(guān)性的時(shí)空數(shù)據(jù)預(yù)測(cè)方法
- 多維時(shí)空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





