[發(fā)明專利]一種多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)系統(tǒng)及檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201711102577.3 | 申請(qǐng)日: | 2017-11-10 |
| 公開(kāi)(公告)號(hào): | CN107886069A | 公開(kāi)(公告)日: | 2018-04-06 |
| 發(fā)明(設(shè)計(jì))人: | 盧紹文;王金鑫;王克棟;郭章;程盟盟;李鵬琦;趙磊;劉曉麗;丁進(jìn)良;柴天佑 | 申請(qǐng)(專利權(quán))人: | 東北大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 沈陽(yáng)優(yōu)普達(dá)知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙)21234 | 代理人: | 張志偉 |
| 地址: | 110169 遼*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多目標(biāo) 人體 姿態(tài) 實(shí)時(shí) 檢測(cè) 系統(tǒng) 方法 | ||
1.一種多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)系統(tǒng),其特征在于,包括:
圖像采集模塊,用于獲取圖像數(shù)據(jù);
實(shí)時(shí)處理模塊,用于將圖像數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)和預(yù)測(cè),并根據(jù)獲取的關(guān)節(jié)點(diǎn)位置的熱點(diǎn)圖和關(guān)節(jié)點(diǎn)之間的方向向量場(chǎng)的熱點(diǎn)圖生成人體的姿態(tài)信息;
可視化顯示模塊,用于將預(yù)測(cè)得到的人體姿態(tài)信息通過(guò)線段連接的方式呈現(xiàn)給用戶。
2.如權(quán)利要求1所述的多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)系統(tǒng),其特征在于,所述圖像采集模塊為USB攝像機(jī)或者網(wǎng)絡(luò)攝像機(jī),用于獲取圖像信息并將圖像信息轉(zhuǎn)換成標(biāo)準(zhǔn)RGB圖像。
3.如權(quán)利要求1所述的多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)系統(tǒng),其特征在于,所述實(shí)時(shí)處理模塊包括:
神經(jīng)網(wǎng)絡(luò)子模塊,用于將圖像數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)和預(yù)測(cè),獲取到關(guān)節(jié)點(diǎn)位置的熱點(diǎn)圖和關(guān)節(jié)點(diǎn)之間的方向向量場(chǎng)的熱點(diǎn)圖,方向向量場(chǎng)的熱點(diǎn)圖描述了兩個(gè)關(guān)節(jié)點(diǎn)是否可以連接在一起組成人體的一部分骨骼;
關(guān)節(jié)點(diǎn)連接子模塊,用于對(duì)神經(jīng)網(wǎng)絡(luò)輸出的兩種熱點(diǎn)圖進(jìn)行融合,將屬于同一人體的關(guān)節(jié)點(diǎn)連接起來(lái),構(gòu)成完整的人體姿態(tài)信息。
4.一種多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)方法,其特征在于,包括:
步驟1:獲取圖像數(shù)據(jù);
步驟2:將圖像數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)和預(yù)測(cè),利用神經(jīng)網(wǎng)絡(luò)提取特征,根據(jù)獲取的關(guān)節(jié)點(diǎn)位置的熱點(diǎn)圖和關(guān)節(jié)點(diǎn)之間的方向向量場(chǎng)的熱點(diǎn)圖生成人體的姿態(tài)信息;
步驟3:將預(yù)測(cè)得到的人體姿態(tài)信息通過(guò)線段連接的方式呈現(xiàn)給用戶。
5.如權(quán)利要求4所述的多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)方法,其特征在于,所述步驟1具體為:
通過(guò)USB攝像機(jī)或者網(wǎng)絡(luò)攝像機(jī)獲取待處理圖像信息,將獲得的圖像信息轉(zhuǎn)換成標(biāo)準(zhǔn)RGB圖像。
6.如權(quán)利要求4所述的多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)方法,其特征在于,所述步驟2包括:
步驟2.1:將歷史圖像數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練;
步驟2.2:將要檢測(cè)的圖像數(shù)據(jù)輸入到訓(xùn)練完的神經(jīng)網(wǎng)絡(luò)模型,利用神經(jīng)網(wǎng)絡(luò)提取特征,得到對(duì)于該圖像預(yù)測(cè)的不同類型關(guān)節(jié)點(diǎn)的熱點(diǎn)圖和關(guān)節(jié)點(diǎn)之間的方向向量場(chǎng)熱點(diǎn)圖;
步驟2.3:對(duì)神經(jīng)網(wǎng)絡(luò)輸出的兩種熱點(diǎn)圖進(jìn)行融合,將屬于同一人體的關(guān)節(jié)點(diǎn)連接起來(lái),構(gòu)成完整的人體姿態(tài)信息。
7.如權(quán)利要求6所述的多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)方法,其特征在于,所述步驟2.1包括:
步驟2.1.1:建立卷積神經(jīng)網(wǎng)絡(luò)的初始模型,卷積神經(jīng)網(wǎng)絡(luò)包括單通道階段和多個(gè)雙通道階段,單通道階段包括:
第一層和第二層為卷積層:對(duì)歷史圖像數(shù)據(jù)進(jìn)行卷積處理;
第三層為池化層:對(duì)第一層和第二層的結(jié)果進(jìn)行下采樣處理;
第四層和第五層為卷積層:對(duì)第三層的圖像進(jìn)行兩層卷積處理;
第六層為池化層:對(duì)第四層和第五層的結(jié)果進(jìn)行下采樣處理;
第七至第十層為卷積層:對(duì)第六層的圖像進(jìn)行四層卷積處理;
第十一層為池化層:對(duì)第七至第十層為卷積層的結(jié)果進(jìn)行下采樣處理;
第十二層和第十三層為卷積層:將第十一層的圖像進(jìn)行兩層卷積處理,得到輸入圖像的特征圖;
步驟2.1.2:將步驟2.1.1得到的輸入圖像的特征圖輸入卷積神經(jīng)網(wǎng)絡(luò)的雙通道階段,得到不同類型關(guān)節(jié)點(diǎn)的熱點(diǎn)圖S和關(guān)節(jié)點(diǎn)之間的方向向量場(chǎng)熱點(diǎn)圖L,關(guān)節(jié)點(diǎn)的熱點(diǎn)圖S表示出一副圖像中所有的關(guān)節(jié)點(diǎn)的位置信息,方向向量場(chǎng)熱點(diǎn)圖L有表示各個(gè)關(guān)節(jié)點(diǎn)之間的關(guān)聯(lián)程度,由若干2D向量組成,2D向量的方向代表了關(guān)節(jié)連接成骨骼的方向;
步驟2.1.3:通過(guò)對(duì)于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的結(jié)果與真實(shí)數(shù)據(jù)之間的誤差,利用反向傳播算法,調(diào)整神經(jīng)網(wǎng)絡(luò)的參數(shù),使得神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的結(jié)果最接近標(biāo)注數(shù)據(jù)的真實(shí)結(jié)果,從而得到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型。
8.如權(quán)利要求6所述的多目標(biāo)人體2D姿態(tài)實(shí)時(shí)檢測(cè)方法,其特征在于,所述步驟2.3包括:
步驟2.3.1:將預(yù)測(cè)得到的關(guān)節(jié)點(diǎn)的熱點(diǎn)圖S和關(guān)節(jié)點(diǎn)之間的方向向量場(chǎng)熱點(diǎn)圖L轉(zhuǎn)化成圖論里求解最大權(quán)重K分圖匹配問(wèn)題,不同類型關(guān)節(jié)點(diǎn)的熱點(diǎn)圖S為K分圖的節(jié)點(diǎn),關(guān)節(jié)點(diǎn)之間的方向向量場(chǎng)熱點(diǎn)圖L代表二分圖的邊的權(quán)重,其中K代表不同關(guān)節(jié)類型的個(gè)數(shù);
步驟2.3.2:利用貪心算法簡(jiǎn)化最大權(quán)重二分圖匹配問(wèn)題:根據(jù)人體關(guān)節(jié)的實(shí)際連接情況簡(jiǎn)化問(wèn)題,將K分圖的匹配問(wèn)題化解成多個(gè)最大權(quán)重二分圖匹配問(wèn)題;
步驟2.3.3:利用匈牙利算法求解所述最大權(quán)重二分圖匹配問(wèn)題,把所有的關(guān)節(jié)點(diǎn)按照求解的結(jié)果連在一起,獲得整的人體姿態(tài)信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711102577.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于實(shí)現(xiàn)多目標(biāo)方業(yè)務(wù)或操作的方法和裝置
- 基于智能視頻分析平臺(tái)的多目標(biāo)跟蹤方法及其系統(tǒng)
- 多目標(biāo)設(shè)計(jì)選擇方法和系統(tǒng)
- 一種針對(duì)多目標(biāo)的地面導(dǎo)航系統(tǒng)及其方法
- 一種無(wú)斷點(diǎn)多目標(biāo)信號(hào)合成方法
- 基于多智能體深度增強(qiáng)學(xué)習(xí)的多目標(biāo)跟蹤方法
- 一種多目標(biāo)跟蹤方法
- 一種航空紅外視頻多目標(biāo)檢測(cè)與跟蹤方法及裝置
- 一種多目標(biāo)推薦方法、多目標(biāo)推薦模型生成方法以及裝置
- 一種區(qū)域多目標(biāo)衛(wèi)星探測(cè)仿真方法及系統(tǒng)
- 一種敏捷衛(wèi)星姿態(tài)機(jī)動(dòng)確定系統(tǒng)
- 座椅自動(dòng)調(diào)節(jié)方法、裝置及終端
- 調(diào)整智能交互機(jī)器人姿態(tài)的方法及智能交互機(jī)器人
- 一種用于同步軌道SAR衛(wèi)星的姿態(tài)機(jī)動(dòng)軌跡計(jì)算方法
- 面部姿態(tài)調(diào)整方法、裝置和終端
- 孕婦姿態(tài)實(shí)時(shí)監(jiān)測(cè)系統(tǒng)
- 具有電磁位置跟蹤的混合姿態(tài)跟蹤系統(tǒng)
- 一種姿態(tài)估計(jì)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于姿態(tài)質(zhì)量評(píng)估的自適應(yīng)人體姿態(tài)優(yōu)化方法
- 一種機(jī)器人姿態(tài)調(diào)整控制系統(tǒng)
- 實(shí)時(shí)解碼系統(tǒng)與實(shí)時(shí)解碼方法
- 實(shí)時(shí)穩(wěn)定
- 實(shí)時(shí)監(jiān)控裝置、實(shí)時(shí)監(jiān)控系統(tǒng)以及實(shí)時(shí)監(jiān)控方法
- 實(shí)時(shí)或準(zhǔn)實(shí)時(shí)流傳輸
- 實(shí)時(shí)或準(zhǔn)實(shí)時(shí)流傳輸
- 實(shí)時(shí)通信方法和實(shí)時(shí)通信系統(tǒng)
- 實(shí)時(shí)更新
- 實(shí)時(shí)內(nèi)核
- 用于通信網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備及相關(guān)方法
- 實(shí)時(shí)量化方法及實(shí)時(shí)量化系統(tǒng)





