[發(fā)明專利]一種基于自適應(yīng)圖卷積神經(jīng)網(wǎng)絡(luò)的動作識別方法和裝置有效
| 申請?zhí)枺?/td> | 202110564099.8 | 申請日: | 2021-05-24 |
| 公開(公告)號: | CN113378656B | 公開(公告)日: | 2023-07-25 |
| 發(fā)明(設(shè)計(jì))人: | 胡凱;丁益武;陸美霞;黃昱錕 | 申請(專利權(quán))人: | 南京信息工程大學(xué) |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V20/40;G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 田凌濤 |
| 地址: | 210044 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 自適應(yīng) 圖卷 神經(jīng)網(wǎng)絡(luò) 動作 識別 方法 裝置 | ||
本發(fā)明公開了一種基于自適應(yīng)圖卷積神經(jīng)網(wǎng)絡(luò)的動作識別方法和裝置,方法包括:S1,生成人體骨骼數(shù)據(jù)集;S2,將相鄰骨骼邊之間的角度作為深層次的空間特征;S3,計(jì)算得到每個(gè)關(guān)鍵節(jié)點(diǎn)的平均能量變化值,將其作為深層次的時(shí)間特征;S4,構(gòu)建雙流圖卷積神經(jīng)網(wǎng)絡(luò);S5,對雙流圖卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行擴(kuò)展,并聯(lián)2個(gè)新增子網(wǎng)絡(luò),搭建動作識別模型,新增子網(wǎng)絡(luò)分別用于對空間特征和時(shí)間特征進(jìn)行處理的子網(wǎng)絡(luò);該動作識別模型用于同時(shí)對關(guān)節(jié)數(shù)據(jù)、骨骼數(shù)據(jù)、深層次的空間特征和深層次的時(shí)間特征進(jìn)行處理,計(jì)算得到對應(yīng)的動作類型。本發(fā)明能夠有效提高圖卷積網(wǎng)絡(luò)在動作識別領(lǐng)域的識別精度。
技術(shù)領(lǐng)域
本發(fā)明涉及視頻流動作識別技術(shù)領(lǐng)域,具體而言涉及一種基于自適應(yīng)圖卷積神經(jīng)網(wǎng)絡(luò)的動作識別方法和裝置。
背景技術(shù)
在機(jī)器學(xué)習(xí)領(lǐng)域,動作識別是一項(xiàng)非常重要的任務(wù),在日常生活中有很多場景能夠使用到,比如自動駕駛、人機(jī)交互、公共安全等,因此,這項(xiàng)任務(wù)受到了越來越多的人關(guān)注。從目前來看,由于近幾年機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的爆發(fā)式發(fā)展,涌現(xiàn)出了很多性能優(yōu)良的動作識別算法,基于時(shí)空圖卷積的動作識別算法取得了優(yōu)良的成績。
現(xiàn)有的基于圖神經(jīng)網(wǎng)絡(luò)的動作識別算法僅利用了非常淺層的特征,一是直接利用了姿態(tài)估計(jì)算法得到的人體關(guān)鍵點(diǎn)的坐標(biāo)及其置信度作為特征,忽略了關(guān)鍵點(diǎn)與關(guān)鍵點(diǎn)之間,關(guān)鍵點(diǎn)與骨骼之間的位置關(guān)系。例如,對于肩膀處的關(guān)鍵點(diǎn)來說,它取決于上半身所處的位置,同時(shí),它又決定著上臂的位置;二是對于動作持續(xù)時(shí)間的長短,沒有明顯的區(qū)分,如摔倒與躺下這兩個(gè)動作,動作是類似的,很明顯在時(shí)間上,摔倒比躺下的時(shí)間更快。這些問題的存在表明了現(xiàn)有方法仍沒有充分提取數(shù)據(jù)的信息。
因此,雖然基于骨架的動作識別算法在公開數(shù)據(jù)集上已經(jīng)取得了卓越的成果,但是目前的算法都僅利用了比較淺層的特征,沒有考慮骨架數(shù)據(jù)節(jié)點(diǎn)與邊之間的關(guān)聯(lián)性,沒有考慮邊與邊之間的關(guān)聯(lián)性,也沒一個(gè)有效的辦法解決類似“摔倒”與“躺下”這類動作的難區(qū)分的問題。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術(shù)中的不足,提供一種基于自適應(yīng)圖卷積神經(jīng)網(wǎng)絡(luò)的動作識別方法和裝置,通過聚焦動作根節(jié)點(diǎn),計(jì)算出一個(gè)動作持續(xù)時(shí)間內(nèi),圍繞同一關(guān)鍵點(diǎn)的兩個(gè)骨骼之間的角度變化,同時(shí)將動作的持續(xù)時(shí)間作為特征輸入給網(wǎng)絡(luò),以解決信息利用不充分的問題,有效提高圖卷積網(wǎng)絡(luò)在動作識別領(lǐng)域的識別精度。
為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
第一方面,本發(fā)明實(shí)施例提出了一種基于自適應(yīng)圖卷積神經(jīng)網(wǎng)絡(luò)的動作識別方法,所述動作識別方法包括:
S1,獲取待識別人體動作類型的視頻流數(shù)據(jù),采用已有的姿態(tài)估計(jì)算法,對導(dǎo)入的視頻流數(shù)據(jù)進(jìn)行處理,得到人體骨架類型數(shù)據(jù)和人體骨骼圖形,生成同時(shí)得到每個(gè)關(guān)鍵節(jié)點(diǎn)的坐標(biāo)及其置信度特征,生成人體骨骼數(shù)據(jù)集;
S2,計(jì)算人體運(yùn)動過程中骨骼圍繞關(guān)鍵節(jié)點(diǎn)轉(zhuǎn)動時(shí)角動量發(fā)生的變化,將相鄰骨骼邊之間的角度這一變量作為深層次的空間特征;
S3,提取人體動作持續(xù)時(shí)間內(nèi)的能量信息,將骨骼圍繞關(guān)鍵節(jié)點(diǎn)轉(zhuǎn)動產(chǎn)生的角度差累加得到在動作持續(xù)時(shí)間內(nèi)角度變化的總和,采用每個(gè)關(guān)鍵節(jié)點(diǎn)對應(yīng)的角度差累加之和除以當(dāng)前動作的關(guān)鍵幀數(shù),計(jì)算得到每個(gè)關(guān)鍵節(jié)點(diǎn)的平均能量變化值,將其作為深層次的時(shí)間特征;
S4,構(gòu)建雙流圖卷積神經(jīng)網(wǎng)絡(luò),其中,關(guān)節(jié)數(shù)據(jù)和骨骼數(shù)據(jù)分別作為J流和B流的輸入數(shù)據(jù),預(yù)測動作標(biāo)簽作為輸出數(shù)據(jù);
S5,對雙流圖卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行擴(kuò)展,并聯(lián)2個(gè)新增子網(wǎng)絡(luò),搭建動作識別模型,新增子網(wǎng)絡(luò)分別用于對空間特征和時(shí)間特征進(jìn)行處理的子網(wǎng)絡(luò);該動作識別模型用于同時(shí)對關(guān)節(jié)數(shù)據(jù)、骨骼數(shù)據(jù)、深層次的空間特征和深層次的時(shí)間特征進(jìn)行處理,計(jì)算得到對應(yīng)的動作類型。
可選的,步驟S2中,所述計(jì)算人體運(yùn)動過程中骨骼圍繞關(guān)鍵節(jié)點(diǎn)轉(zhuǎn)動時(shí)角動量發(fā)生的變化,將相鄰骨骼邊之間的角度這一變量作為深層次的空間特征的過程包括以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京信息工程大學(xué),未經(jīng)南京信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110564099.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種微生物分離檢驗(yàn)裝置
- 下一篇:一種基于碳纖維骨架檢具與制作方法
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動機(jī)
- 一種自適應(yīng)樹木自動涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 一種腸胃鏡配套清潔達(dá)標(biāo)圖譜
- 一種混合高低階圖卷積傳播系統(tǒng)
- 基于圖結(jié)構(gòu)矩陣特征向量的圖卷積神經(jīng)網(wǎng)絡(luò)生成方法
- 基于骨骼關(guān)節(jié)點(diǎn)的圖卷積行為識別方法及裝置
- 一種基于網(wǎng)絡(luò)結(jié)構(gòu)增強(qiáng)的圖卷積模型防御方法、裝置和系統(tǒng)
- 一種基于骨架的雙流自適應(yīng)圖卷積網(wǎng)絡(luò)行為識別方法
- 一種基于時(shí)空圖卷積網(wǎng)絡(luò)的人臉檢測方法及裝置
- 一種基于權(quán)重不確定的圖卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法、裝置
- 一種基于圖自編碼器的融合子空間聚類方法及系統(tǒng)
- 基于圖卷積神經(jīng)網(wǎng)絡(luò)交互的推薦方法及系統(tǒng)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





