[發明專利]建立人體姿態識別模型的方法、人體姿態識別方法及裝置在審
| 申請號: | 201910778981.5 | 申請日: | 2019-08-22 |
| 公開(公告)號: | CN112417927A | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 劉洛麒 | 申請(專利權)人: | 北京奇虎科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 王玉雙 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 建立 人體 姿態 識別 模型 方法 裝置 | ||
本發明涉及圖像識別技術領域,尤其涉及建立人體姿態識別模型的方法、人體姿態識別方法及裝置,所述方法包括:獲取圖像訓練數據,其中,圖像訓練數據包含當前幀圖像和前一幀圖像,前一幀圖像位于當前幀圖像的前一幀,當前幀圖像具有已確定的人體姿態;對前一幀圖像中的人體關鍵點坐標進行升維處理,獲得與前一幀圖像對應的升維圖像;將當前幀圖像與升維圖像進行拼接,獲得拼接圖像;將與當前幀圖像對應的人體姿態的人體關鍵點坐標作為訓練標簽,利用深度神經網絡對拼接圖像進行訓練,獲得人體姿態識別模型。本發明提高了人體姿態識別結果的準確性。
技術領域
本發明涉及圖像識別技術領域,尤其涉及建立人體姿態識別模型的方法、人體姿態識別方法及裝置。
背景技術
人體姿態識別在計算機視覺、模式識別、人工智能等領域中,已經成為一個極具意義的研究熱點,其具有廣闊的應用領域,包括虛擬現實、生物力學、游戲、醫療健康等人機交互領域。
在現有技術中,對于視頻而言,在識別視頻中人物的人體姿態時,通常基于每一幀圖像本身進行人體姿態識別。例如,視頻按照時間順序包含第一幀和第二幀,則,根據第一幀圖像對第一幀圖像中人物的人體姿態進行識別,得到與第一幀圖像對應的第一人體姿態,根據第二幀圖像對第二幀圖像中人物的人體姿態進行識別,得到與第二幀圖像對應的第二人體姿態。然而,采用上述直接利用當前幀圖像進行人體姿態識別的方法,得到的識別結果準確率低,難以準確地識別出每一幀圖像的人體姿態。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的建立人體姿態識別模型的方法、人體姿態識別方法及裝置。
依據本發明的第一個方面,本發明提供了一種建立人體姿態識別模型的方法,所述方法包括:
獲取圖像訓練數據,其中,所述圖像訓練數據包含當前幀圖像和前一幀圖像,所述前一幀圖像位于所述當前幀圖像的前一幀,所述當前幀圖像具有已確定的人體姿態;
對所述前一幀圖像中的人體關鍵點坐標進行升維處理,獲得與所述前一幀圖像對應的升維圖像;
將所述當前幀圖像與所述升維圖像進行拼接,獲得拼接圖像;
將與所述當前幀圖像對應的所述人體姿態的人體關鍵點坐標作為訓練標簽,利用深度神經網絡對所述拼接圖像進行訓練,獲得人體姿態識別模型。
優選的,當所述前一幀圖像包含n個人體關鍵點坐標時,所述對所述前一幀圖像中的人體關鍵點坐標進行升維處理,包括:
基于高斯分布將所述n個人體關鍵點坐標轉換為n維圖像。
優選的,所述將所述當前幀圖像與所述升維圖像進行拼接,包括:
利用堆疊方式對所述當前幀圖像和所述升維圖像進行拼接。
優選的,所述深度神經網絡包括神經網絡卷積層和與預設訓練條件相對應的目標訓練尾層。
優選的,所述圖像訓練數據為彩色圖像或灰度圖像。
依據本發明的第二個方面,本發明提供了一種人體姿態識別方法,所述方法包括:
獲取待識別圖像以及位于所述待識別圖像前一幀的目標前一幀圖像;
將所述目標前一幀圖像的人體關鍵點坐標和所述待識別圖像作為輸入數據,輸入至通過根據前述第一個方面的建立人體姿態識別模型的方法獲得的所述人體姿態識別模型中,利用所述人體姿態識別模型對所述待識別圖像進行人體姿態識別,獲得所述待識別圖像的人體關鍵點坐標;
基于所述待識別圖像的人體關鍵點坐標,確定與所述待識別圖像對應的人體姿態。
優選的,在所述獲得所述待識別圖像的人體關鍵點坐標之后,且,在所述確定與所述待識別圖像對應的人體姿態之前,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司,未經北京奇虎科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910778981.5/2.html,轉載請聲明來源鉆瓜專利網。





