[發(fā)明專利]一種基于YOLOv3算法的多人姿態(tài)估計方法在審
| 申請?zhí)枺?/td> | 201910069350.6 | 申請日: | 2019-01-24 |
| 公開(公告)號: | CN109815901A | 公開(公告)日: | 2019-05-28 |
| 發(fā)明(設計)人: | 蔡哲棟;應娜;黃鐸;楊鵬 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 杭州千克知識產權代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 姿態(tài)估計 算法 網絡模型 數據集 單類 人體檢測器 提取模塊 圖片切割 網絡框架 行人檢測 行人數據 原始圖像 綜合數據 級聯 圖像 檢測 網絡 | ||
本發(fā)明公開一種基于YOLOv3算法的多人姿態(tài)估計方法,包括步驟:S1:處理綜合數據集,得到滿足方法需要的單類行人數據集;S2:設計圖片切割提取模塊,將YOLOv3算法和Stacked Hourglass算法合理結合得到多人姿態(tài)估計網絡框架;S3:訓練S1所述數據集得到單類行人檢測的YOLOv3網絡模型,訓練MPII數據集得到Hourglass姿態(tài)估計網絡模型。將訓練得到的YOLOv3網絡模型和級聯4個Hourglass網絡得到的Stacked Hourglass網絡模型進行合理結合,得到基于YOLOv3算法的多人姿態(tài)估計網絡模型;S4:輸入原始圖像,得到多人姿態(tài)估計建議的圖像。本發(fā)明基于最新的YOLOv3算法,通過提升人體檢測器的檢測能力,提高了多人姿態(tài)估計的準確性,提升了對全局性的把控。
技術領域
本發(fā)明屬于圖像處理的目標檢測領域,主要涉及行人姿態(tài)估計,具體來說,即基于YOLOv3算法的多人姿態(tài)估計方法。
背景技術
人體姿態(tài)估計一直都是計算機視覺熱門的研究方向之一。近年來由于深度學習在圖像處理領域表現優(yōu)異,基于深度學習的人體姿態(tài)估計也蓬勃發(fā)展起來。
YOLOv3算法屬于目標檢測領域,通過深度學習使網絡模型具備識別圖像上行人的能力;Stacked Hourglass算法屬于圖像處理領域,其基礎網絡為殘差網絡模塊,并通過級聯多個基礎網絡提高對單人姿態(tài)估計的準確性和實時性。
目前主流的多人姿態(tài)估計主要是采用自頂向下框架,也就是從整體-局部-整體的思想,通過結合目標檢測算法和單人姿態(tài)估計算法實現。但由于復雜背景、多人識別和人體阻擋等因素,在準確性和實時性上依舊有較大提升空間。
發(fā)明內容
針對上述問題,我們提出了一種基于YOLOv3算法的多人姿態(tài)估計方法。本發(fā)明使用YOLOv3算法檢測識別行人目標,通過結合Stacked Hourglass算法實現多人姿態(tài)估計。利用YOLOv3算法的目標檢測預估性和準確性,降低多人識別和人體阻擋等因素對多人姿態(tài)估計造成的負面影響;利用切割提取和中心點回歸原則,降低復雜背景對多人姿態(tài)估計造成的負面影響。
本發(fā)明采取如下技術方案:
一種基于YOLOv3算法的多人姿態(tài)估計方法,包括步驟:
S1:處理綜合數據集,得到滿足方法需要的單類行人數據集;
S2:設計圖片切割提取模塊,將YOLOv3算法和Stacked Hourglass算法合理結合得到多人姿態(tài)估計網絡框架;
S3:訓練S1所述數據集得到單類行人檢測的YOLOv3網絡模型,訓練MPII數據集得到Hourglass姿態(tài)估計網絡模型。將訓練得到的YOLOv3網絡模型和級聯4個Hourglass網絡得到的Stacked Hourglass網絡模型進行合理結合,得到基于YOLOv3算法的多人姿態(tài)估計網絡模型;
S4:輸入原始圖像,得到多人姿態(tài)估計建議的圖像。
優(yōu)選地,所述步驟S3具體實施步驟如下:
S3.1:利用Darknet深度學習框架進行單類行人的YOLOv3網絡模型訓練;利用Pytorch深度學習框架進行Hourglass網絡模型訓練,將訓練好的4個Hourglass網絡模型進行級聯得到Stacked Hourglass網絡模型。
S3.2:利用訓練得到的YOLOv3網絡模型進行行人檢測識別,通過極大值抑制得到置信度最高的人體包圍框。
S3.3:將人體包圍框進行切割提取,輸入至Stacked Hourglass網絡進行姿態(tài)估計建議。
S3.4:利用中心點回歸原則進行姿態(tài)估計建議回歸,得到多人姿態(tài)估計建議。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910069350.6/2.html,轉載請聲明來源鉆瓜專利網。





