[發(fā)明專(zhuān)利]基于目標(biāo)檢測(cè)和人體姿態(tài)估計(jì)的坐姿檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810357864.7 | 申請(qǐng)日: | 2018-04-20 |
| 公開(kāi)(公告)號(hào): | CN108549876A | 公開(kāi)(公告)日: | 2018-09-18 |
| 發(fā)明(設(shè)計(jì))人: | 高陳強(qiáng);湯林;陳旭;汪瀾;韓慧 | 申請(qǐng)(專(zhuān)利權(quán))人: | 重慶郵電大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 重慶輝騰律師事務(wù)所 50215 | 代理人: | 王海軍 |
| 地址: | 400065 重*** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標(biāo)檢測(cè) 人體姿態(tài) 坐姿檢測(cè) 融合 計(jì)算機(jī)視覺(jué)技術(shù) 分類(lèi)準(zhǔn)確率 可穿戴設(shè)備 反向傳播 分類(lèi)結(jié)果 激活函數(shù) 目標(biāo)丟失 任務(wù)目標(biāo) 特征輸入 圖像處理 網(wǎng)絡(luò)參數(shù) 誤差信號(hào) 訓(xùn)練網(wǎng)絡(luò) 傳統(tǒng)的 多目標(biāo) 訓(xùn)練集 驗(yàn)證集 傳感器 坐姿 算法 驗(yàn)證 傳遞 分類(lèi) 人群 回歸 更新 | ||
1.基于目標(biāo)檢測(cè)和人體姿態(tài)估計(jì)的坐姿檢測(cè)方法,其特征在于,利用卷積神經(jīng)網(wǎng)絡(luò)CNN進(jìn)行坐姿檢測(cè),且輸入到CNN中的融合特征提取包括如下步驟:
S1:對(duì)原始圖像進(jìn)行人工標(biāo)注,標(biāo)注信息包括包圍框Bounding Box、坐姿類(lèi)別和關(guān)節(jié)點(diǎn)坐標(biāo);
S2:將原始圖像輸入到目標(biāo)檢測(cè)網(wǎng)絡(luò),利用Bounding Box信息截取出單人目標(biāo)圖像;
S3:將單人目標(biāo)圖像按坐姿類(lèi)別進(jìn)行關(guān)節(jié)點(diǎn)標(biāo)記,再將標(biāo)記的單人目標(biāo)圖像輸入到卷積神經(jīng)網(wǎng)絡(luò),提取最后一個(gè)卷積層輸出的深度神經(jīng)網(wǎng)絡(luò)特征作為特征I;
S4:將關(guān)節(jié)點(diǎn)坐標(biāo)信息和Bounding Box信息輸入到多人姿態(tài)估計(jì)網(wǎng)絡(luò),然后對(duì)原始圖像做多人姿態(tài)估計(jì),并將多人姿態(tài)估計(jì)圖截取為單人人體骨架圖;
S5:將單人人體骨架圖輸入到卷積神經(jīng)網(wǎng)絡(luò),提取最后一個(gè)卷積層輸出的深度神經(jīng)網(wǎng)絡(luò)特征作為特征II;
S6:將特征I和特征II進(jìn)行融合。
2.如權(quán)利要求1所述的基于目標(biāo)檢測(cè)和人體姿態(tài)估計(jì)的坐姿檢測(cè)方法,其特征在于,還包括步驟S7:將融合后的特征輸入CNN中,若融合特征來(lái)自于訓(xùn)練集,則用于訓(xùn)練網(wǎng)絡(luò)參數(shù);若融合特征來(lái)自驗(yàn)證集,則用于驗(yàn)證網(wǎng)絡(luò)參數(shù),并通過(guò)反向傳播算法傳遞誤差信號(hào),更新梯度,尋找最優(yōu)值,利用柔性最大激活函數(shù)Softmax做分類(lèi)回歸,得到最終的分類(lèi)結(jié)果和分類(lèi)準(zhǔn)確率。
3.如權(quán)利要求1所述的基于目標(biāo)檢測(cè)和人體姿態(tài)估計(jì)的坐姿檢測(cè)方法,其特征在于,步驟S2具體包括:
所述目標(biāo)檢測(cè)網(wǎng)絡(luò)采用Faster RCNN網(wǎng)絡(luò),F(xiàn)aster RCNN網(wǎng)絡(luò)由一個(gè)候選區(qū)域網(wǎng)絡(luò)RPN和一個(gè)Fast RCNN網(wǎng)絡(luò)組成級(jí)聯(lián)網(wǎng)絡(luò);在第一個(gè)階段利用RPN在原始圖像中選擇出推薦區(qū)域,在第二個(gè)階段利用Fast RCNN對(duì)推薦區(qū)域內(nèi)的目標(biāo)進(jìn)一步細(xì)分,截取出單人目標(biāo)圖像。
4.如權(quán)利要求3所述的基于目標(biāo)檢測(cè)和人體姿態(tài)估計(jì)的坐姿檢測(cè)方法,其特征在于,所述利用RPN在原始圖像中選擇推薦區(qū)域,具體包括:
對(duì)人工標(biāo)注的Bounding Box包圍區(qū)域進(jìn)行采樣,且采樣區(qū)域?yàn)檎龢颖緟^(qū)域時(shí)選擇該采樣區(qū)域?yàn)橥扑]區(qū)域;所述正樣本區(qū)域是指采樣區(qū)域與Bounding Box包圍區(qū)域的重疊率大于閾值時(shí),該采樣區(qū)域?yàn)檎龢颖緟^(qū)域,閾值為0.6~0.9。
5.如權(quán)利要求4所述的基于目標(biāo)檢測(cè)和人體姿態(tài)估計(jì)的坐姿檢測(cè)方法,其特征在于,所述采樣區(qū)域與Bounding Box包圍區(qū)域的重疊率計(jì)算公式為:
其中:area(rg)為Bounding Box包圍區(qū)域,area(rn)為采樣區(qū)域。
6.如權(quán)利要求1所述的基于目標(biāo)檢測(cè)和人體姿態(tài)估計(jì)的坐姿檢測(cè)方法,其特征在于,步驟S3具體包括:
根據(jù)坐姿類(lèi)別給單人目標(biāo)圖像賦予標(biāo)簽,將標(biāo)記的單人目標(biāo)圖像分為訓(xùn)練子集I和驗(yàn)證子集I,在CNN分類(lèi)網(wǎng)絡(luò)中輸入為40×40像素的三通道單人目標(biāo)圖像,包含三個(gè)卷積層和對(duì)應(yīng)的非線(xiàn)性激活單元,前兩個(gè)卷積層用來(lái)表示圖像的高水平特征,最后一個(gè)卷積層用來(lái)產(chǎn)生高層次的特征反應(yīng),提取最后一個(gè)卷積層產(chǎn)生的特征圖作為與后續(xù)階段融合的特征,即特征I。
7.如權(quán)利要求1所述的基于目標(biāo)檢測(cè)和人體姿態(tài)估計(jì)的坐姿檢測(cè)方法,其特征在于:步驟S4具體包括:
多人姿態(tài)估計(jì)采用G-RMI方法,第一階段用Faster RCNN網(wǎng)絡(luò)檢測(cè)原始圖像中的多個(gè)人,并對(duì)Bounding Box覆蓋區(qū)域進(jìn)行截取;第二個(gè)階段采用基于全卷積網(wǎng)絡(luò)的殘差網(wǎng)絡(luò)Resnet對(duì)Bounding Box覆蓋區(qū)域中的每一個(gè)人物預(yù)測(cè)密集熱圖Dense Heatmap和補(bǔ)償Offset;最后通過(guò)Dense Heatmap和Offset的融合得到關(guān)鍵點(diǎn)的精確定位,從而得到單人人體骨架圖。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810357864.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種三維人體姿態(tài)估計(jì)方法和裝置
- 一種人體運(yùn)動(dòng)姿態(tài)校正系統(tǒng)
- 一種人體姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種人體三維姿態(tài)匹配算法的優(yōu)化方法
- 一種基于擴(kuò)展卡爾曼濾波器的人體姿態(tài)識(shí)別方法
- 一種非接觸式輸入方法及裝置
- 人體姿態(tài)監(jiān)控方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于位置偏移的事件相機(jī)人體姿態(tài)估計(jì)方法及系統(tǒng)
- 一種基于姿態(tài)質(zhì)量評(píng)估的自適應(yīng)人體姿態(tài)優(yōu)化方法
- 一種高空墜落保護(hù)方法、裝置、氣囊和存儲(chǔ)介質(zhì)





