[發明專利]一種基于深度學習的非常態下行人識別方法及系統在審
| 申請號: | 202111471511.8 | 申請日: | 2021-12-06 |
| 公開(公告)號: | CN113901962A | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 李之紅;張晶;王子男;高秀麗 | 申請(專利權)人: | 北京建筑大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 韓雪梅 |
| 地址: | 100044*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 常態 行人 識別 方法 系統 | ||
本發明提供了一種基于深度學習的非常態下行人識別方法及系統,首先基于深度學習框架,利用YOLOV3模型構建初始識別模型;然后采用梯度下降算法,將所述訓練集輸入所述初始識別模型中進行訓練,將最小總損失函數對應的所述初始識別模型作為非常態下行人識別模型;最后將待檢測的目標視頻圖像輸入至所述非常態下行人識別模型中進行行人識別標注,采用非極大值抑制方法剔除多余的先驗框,獲得行人識別最終標注圖。本發明基于深度學習構建非常態下行人識別模型,進而采用非極大值抑制方法剔除多余的先驗框,提升了非常態下行人識別精度。
技術領域
本發明涉及圖像處理技術領域,特別是涉及一種基于深度學習的非常態下行人識別方法及系統。
背景技術
目標檢測是圖像處理和計算機視覺的重要分支,也是智能監控系統的核心部分,對后續的目標跟蹤、軌跡預測等任務起著至關重要的作用。隨著目標檢測技術的發展,智能視頻監控手段得以廣泛應用,然而視頻監控易受到背景、光線等外部環境的影響,而且相比于常態下的行人檢測,非常態環境下的行人檢測是非常復雜的問題,存在著行人間相互遮擋、小目標較多、動作行為隨機等技術困難,進而導致識別精度較低。
發明內容
本發明的目的是提供一種基于深度學習的非常態下行人識別方法及系統,以提高行人識別精度。
為實現上述目的,本發明提供了一種基于深度學習的非常態下行人識別方法,所述方法包括:
步驟S1:構建樣本訓練集;
步驟S2:基于深度學習框架,利用YOLOV3模型構建初始識別模型;
步驟S3:采用梯度下降算法,將所述訓練集輸入所述初始識別模型中進行訓練,將最小總損失函數對應的所述初始識別模型作為非常態下行人識別模型;所述非常態下行人識別模型包括:特征提取網絡、多尺度提取融合網絡和先驗框標注網絡;
步驟S4:將待檢測的目標視頻圖像輸入至所述非常態下行人識別模型中進行行人識別標注,采用非極大值抑制方法剔除多余的先驗框,獲得行人識別最終標注圖。
可選地,所述將待檢測的目標視頻圖像輸入至所述非常態下行人識別模型中進行行人識別標注,采用非極大值抑制方法剔除多余的先驗框,獲得行人識別最終標注圖,具體包括:
步驟S41:將待檢測的目標視頻圖像輸入至特征提取網絡進行特征提取,獲得不同尺度的初始特征圖;
步驟S42:將不同尺度的初始特征圖輸入多尺度提取融合網絡進行特征提取和融合,獲得不同尺度的融合特征圖;
步驟S43:選各融合特征圖對應的先驗框;
步驟S44:將不同尺度的融合特征圖輸入先驗框標注網絡,對不同尺度的融合特征圖中的行人按照各融合特征圖對應的先驗框進行標注,獲得不同尺寸的行人識別初始標注圖;
步驟S45:將不同尺寸的行人識別初始標注圖進行疊加融合,獲得總融合特征圖;
步驟S46:采用非極大值抑制方法剔除所述總融合特征圖上多余的先驗框,輸出行人識別最終標注圖。
可選地,所述特征提取網絡包括:第一特征提取模塊、第二特征提取模塊、第三特征提取模塊、第四特征提取模塊和第五特征提取模塊,第一特征提取模塊依次通過第二特征提取模塊、第三特征提取模塊、第四特征提取模塊和第五特征提取模塊連接;
第一特征提取模塊包括2個卷積塊和1個殘差塊,第1個卷積塊通過第2個卷積塊和殘差塊連接;殘差塊包括2個卷積塊,第1個卷積塊分別與第2個卷積塊和第一特征提取模塊中第2個卷積塊連接;殘差塊中的第2個卷積塊輸出的特征圖與第一特征提取模塊中的第2個卷積塊輸出的特征圖相加,并將相加結果輸入至第二特征提取模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京建筑大學,未經北京建筑大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111471511.8/2.html,轉載請聲明來源鉆瓜專利網。





