[發明專利]基于分組卷積的人體姿態識別方法、裝置、設備和介質在審
| 申請號: | 202010591669.8 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111753736A | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 袁振杰;郝瑞;雒冬梅;李慧強;宋亞蓮 | 申請(專利權)人: | 北京軟通智慧城市科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100193 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分組 卷積 人體 姿態 識別 方法 裝置 設備 介質 | ||
1.一種基于分組卷積的人體姿態識別方法,其特征在于,包括:
獲取待識別圖像;
將所述待識別圖像輸入到人體姿態識別模型中,得到所述人體姿態識別模型的輸出結果;其中,所述人體姿態識別模型中包括至少兩組卷積單元,用于得到待識別圖像的至少兩個特征數據;
根據所述輸出結果,確定待識別圖像中的人體姿態。
2.根據權利要求1所述的方法,其特征在于,所述人體姿態識別模型的訓練過程包括:
獲取樣本集圖像;
將所述樣本集圖像輸入到至少兩組卷積單元中,得到所述樣本集圖像的至少兩個特征數據;
對所述至少兩個特征數據進行特征合并,得到所述樣本集圖像的綜合特征;
根據所述綜合特征確定人體姿態識別模型的訓練結果;
將所述訓練結果進行反向傳播,以優化人體姿態識別模型的參數,對人體姿態識別模型進行訓練。
3.根據權利要求1或2中任一所述的方法,其特征在于,所述卷積單元中包括至少一個上采樣卷積組、下采樣卷積組和尺度不變卷積組;其中,所述上采樣卷積組包括卷積層和轉置卷積層,所述上下采樣卷積組包括至少兩個采用非等距滑動步長的卷積層,所述尺度不變卷積組包括至少一個采用邊界填充的卷積層;通過調整所述卷積單元中三種卷積組的設置數量以調整得到的特征數據的大小。
4.根據權利要求2所述的方法,其特征在于,對所述至少兩個特征數據進行特征合并,得到所述樣本集圖像的綜合特征,包括:
對所述至少兩個特征數據在相同維度上進行拼接,得到拼接后的特征數據;
對所述拼接后的特征數據進行批標準化處理以及線性處理,得到所述樣本集圖像的綜合特征。
5.根據權利要求2所述的方法,其特征在于,根據所述綜合特征確定人體姿態識別模型的訓練結果,包括:
將所述綜合特征分別通過池化層、全連接層以及回歸分類層,得到人體姿態識別模型的訓練結果。
6.根據權利要求2所述的方法,其特征在于,將所述訓練結果進行反向傳播,以優化人體姿態識別模型的參數,對人體姿態識別模型進行訓練,包括:
基于所述訓練結果和預先設置的樣本集圖像關聯標簽確定損失函數的輸出值;
通過所述損失函數的輸出值進行梯度下降計算,完成反向傳播,以優化人體姿態識別模型的參數,對人體姿態識別模型進行訓練。
7.根據權利要求2所述的方法,其特征在于,將所述樣本集圖像輸入到至少兩組卷積單元中,得到所述樣本集圖像的至少兩個特征數據之前,還包括:
對所述樣本集圖像進行預處理,得到預處理后的樣本集圖像;其中,所述預處理包括如下至少一項:數據增強、圖像平滑、邊緣提取以及邊緣高度歸一化。
8.一種基于分組卷積的人體姿態識別裝置,其特征在于,包括:
圖像獲取模塊,用于獲取待識別圖像;
輸出結果確定模塊,用于將所述待識別圖像輸入到人體姿態識別模型中,得到所述人體姿態識別模型的輸出結果;其中,所述人體姿態識別模型中包括至少兩組卷積單元,用于得到待識別圖像的至少兩個特征數據;
姿態識別模塊,用于根據所述輸出結果,確定待識別圖像中的人體姿態。
9.一種設備,其特征在于,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-7中任一所述的基于分組卷積的人體姿態識別方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-7中任一所述的基于分組卷積的人體姿態識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京軟通智慧城市科技有限公司,未經北京軟通智慧城市科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010591669.8/1.html,轉載請聲明來源鉆瓜專利網。





