[發明專利]一種基于解耦階梯網絡的姿態估計方法有效
| 申請號: | 202011307337.9 | 申請日: | 2020-11-20 |
| 公開(公告)號: | CN112418070B | 公開(公告)日: | 2023-06-02 |
| 發明(設計)人: | 駱炎民;歐志龍;林躬耕 | 申請(專利權)人: | 華僑大學;福建省公田軟件股份有限公司 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06V10/25;G06V10/764;G06V10/82;G06N3/0464;G06N3/08;G06T5/30;G06T7/62 |
| 代理公司: | 泉州市文華專利代理有限公司 35205 | 代理人: | 陳雪瑩 |
| 地址: | 362000 福建*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 階梯 網絡 姿態 估計 方法 | ||
本發明提供了人體姿態估計技術領域的一種基于解耦階梯網絡的姿態估計方法,包括如下步驟:步驟S10、基于解耦殘差模塊和瀑布模塊搭建解耦階梯網絡;步驟S20、獲取大量的人體樣本圖像,利用所述人體樣本圖像對解耦階梯網絡進行訓練;步驟S30、將待測圖像輸入訓練好的所述解耦階梯網絡,計算所述待測圖像中各關節點的位置,進而基于各關節點的位置形成完整的人體姿態。本發明的優點在于:極大的提升了人體姿態估計的速度以及精度。
技術領域
本發明涉及人體姿態估計技術領域,特別指一種基于解耦階梯網絡的姿態估計方法。
背景技術
人體姿態估計是計算機視覺進一步理解人體行為的關鍵步驟,通過一張RGB圖像能有效預測出人體所有關節點并形成正確的姿態,而準確預測出人體姿態對更高級別的計算機視覺任務,如人的行為識別、人機交互、行人重識別、異常行為檢測等具有重要的意義。
盡管人體姿態估計領域發展迅速,但目前不論是自頂向下還是自底向上的方法,均存在網絡結構復雜且參數量大的問題,使得在訓練網絡時不知道哪一部分較為關鍵,導致網絡訓練速度變慢。為了降低網絡結構的復雜度,減少參數量,傳統的做法只是簡單的把一些卷積核進行替換,丟失了對關節點的感受野的考慮;且傳統的姿態估計方法對于不同尺度大小的任務區分程度不夠,使得一些較小尺度的任務被忽略,進而導致降低了人體姿態估計的精度。
在網絡結構設計方面,Cai?Y,Wang?Z,Luo?Z等人(arXiv?preprint?arXiv:2003.04030,2020.)在論文“Learning?Delicate?Local?Representations?for?Multi-Person?Pose?Estimation”中提出了一種殘差階梯塊,每一個殘差階梯塊都包含四個分支,每個分支的感受野大小并不相同,且輸入的特征圖大小一致,通過多個卷積將不同分支的感受野進行融合,最后再進行concat操作,雖然提高了網絡的感受野,但由于多個分支融合再進行concat操作,增加了網絡參數量,從而導致網絡訓練速度與推理速度低下。
在基于RGB圖像的姿態估計方法中,Sun?K,Xiao?B,Liu?D等人(19th?Proceedingsof?the?IEEE?conference?on?computer?vision?and?pattern?recognition.2019:5693-5703.)在論文“Deep?high-resolution?representation?learning?for?human?poseestimation”中提出一種基于ResNet的網絡來進行姿態估計,通過源碼發現該論文設計的網絡參數量較大,不利于訓練,同時復雜的網絡結構導致推理和訓練速度較慢,對于計算資源較少的用戶而言,極大的提高了用戶的訓練成本。
專利公開號為CN104850845A的中國專利公開了一種基于非對稱卷積神經網絡的交通標志識別方法,采用兩個不同結構的卷積神經網絡并行地進行特征映射和提取,最后將特征進行合并,再經過全連接層和最后的分類器,完成整個分類過程。該方法確保了圖像特征的多樣性,提高了識別精度并加快了網絡運算速度,對于人體姿態估計領域而言,雖然提高了網絡運算速度,但是降低了人體姿態估計的精確度。
因此,如何提供一種基于解耦階梯網絡的姿態估計方法,實現提升人體姿態估計的速度以及精度,成為一個亟待解決的問題。
發明內容
本發明要解決的技術問題,在于提供一種基于解耦階梯網絡的姿態估計方法,實現提升人體姿態估計的速度以及精度。
本發明是這樣實現的:一種基于解耦階梯網絡的姿態估計方法,包括如下步驟:
步驟S10、基于解耦殘差模塊和瀑布模塊搭建解耦階梯網絡;
步驟S20、獲取大量的人體樣本圖像,利用所述人體樣本圖像對解耦階梯網絡進行訓練;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華僑大學;福建省公田軟件股份有限公司,未經華僑大學;福建省公田軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011307337.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有高效排油煙功能的共享驅動裝置
- 下一篇:一種檳榔冷發籽的方法





