[發明專利]一種基于人體行為識別網絡模型的識別方法有效
| 申請號: | 202010457834.0 | 申請日: | 2020-05-27 |
| 公開(公告)號: | CN111626197B | 公開(公告)日: | 2023-03-10 |
| 發明(設計)人: | 張鵬超;羅朝陽 | 申請(專利權)人: | 陜西理工大學 |
| 主分類號: | G06V40/20 | 分類號: | G06V40/20;G06N3/048;G06N3/08 |
| 代理公司: | 成都方圓聿聯專利代理事務所(普通合伙) 51241 | 代理人: | 李鵬 |
| 地址: | 723000 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人體 行為 識別 網絡 模型 方法 | ||
1.一種基于人體行為識別網絡模型的識別方法,其特征在于:
網絡模型依次包括第一3D卷積層、BN層、relu激活函數層、第一最大池化層、block網絡塊、全局均值池化層和softmax激活函數層;
所述第一3D卷積層用于將輸入的連續視頻幀的維度提高然后依次經過所述BN層和relu激活函數層后進入所述第一最大池化層作最大池化操作;
所述block網絡塊中每個輸入通道對應一個3D卷積核用于實現特征的快速提取、降維和最大池化的操作后通過所述全局均值池化層進行處理后輸入到所述softmax激活函數層;
所述softmax激活函數層用于輸出形態類別;
網絡模型訓練測試步驟包括以下內容:
采集大量人體行為數據并標注行為類別作為數據訓練集,通過標注行為類別讓網絡學習標注行為的特征,并進行預測;
將數據訓練集輸入網絡模型中,通過提取連續圖像幀中的特征進行前向傳播得到訓練類別,再經損失函數反向傳播更新參數;
當損失值滿足要求時,停止學習,網絡模型訓練初步完成,否則繼續訓練;
選取一定數量人體行為數據作為測試集輸入到上述完成訓練的網絡模型中,通過前向傳播得到行為類別,并與原標簽進行比對,得到比對結果的正確率;
如果正確率滿足要求,則表示此網絡模型測試通過,否則更新調節參數后繼續對該網絡模型進行訓練;
所述識別方法包括:
將連續的視頻序列輸入到網絡模型中的第一3D卷積層升高維度后依次進入BN層和relu激活函數層;
將所述relu激活函數層的輸出輸入到block網絡塊中的第一block層、第二block層、第三block層、第四block層和第五block層進行特征提取、降維和最大池化處理后輸入到全局均值池化層;
所述全局均值池化層對輸入數據做正則化防止過擬合后輸出到softmax激活函數層,最后輸出形態類別。
2.根據權利要求1所述的一種基于人體行為識別網絡模型的識別方法,其特征在于:所述block網絡塊包括有第一block層、第二block層、第三block層、第四block層和第五block層;其中,后面的block層為前面的block層的充分學習提供特征;在每兩個block層之間都設置有transition layer過渡層,用于對每個block層的輸出進行降維。
3.根據權利要求2所述的一種基于人體行為識別網絡模型的識別方法,其特征在于:所述第一block層包括有4個dense block單元,所述第二block層包括有8個dense block單元,所述第三block層包括有16個dense block單元,所述第四block層包括有32個denseblock單元,所述第五block層包括有64個dense block單元,通過每層block層中denseblock單元數量的依次增多由淺到深的提取特征,實現dense block單元的特征復用。
4.根據權利要求3所述的一種基于人體行為識別網絡模型的識別方法,其特征在于:每個block層中的dense block單元中的每個輸入通道對應一個3D卷積核以進一步減小網絡參數和計算量。
5.根據權利要求2所述的一種基于人體行為識別網絡模型的識別方法,其特征在于:所述transition layer過渡層包括第二3D卷積層和第二最大池化層,以實現對每個block層的輸出進行降維和最大池化處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西理工大學,未經陜西理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010457834.0/1.html,轉載請聲明來源鉆瓜專利網。





