[發明專利]一種基于多尺度時空傳播層的運動目標檢測方法有效
| 申請號: | 202010895232.3 | 申請日: | 2020-08-31 |
| 公開(公告)號: | CN112036300B | 公開(公告)日: | 2022-08-05 |
| 發明(設計)人: | 楊依忠;阮嘉濠;黨政;解光軍;程心;張章 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/25;G06V10/80;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 尺度 時空 傳播 運動 目標 檢測 方法 | ||
本發明公開了一種基于多尺度時空傳播層的運動目標檢測方法,其步驟如下:1獲取具有像素級標簽的視頻數據集;2構建搭載多尺度時空傳播層的網絡模型;3訓練多尺度時空傳播層的網絡模型;4利用訓練好的模型進行預測,以確認其性能能達到運動目標檢測的要求。本發明能為解決現有的運動目標檢測對時空特征提取方法的單一、魯棒性差、只注重局部信息等問題,從而能快速準確檢測在不同挑戰場景下的前景目標,并加強對前景檢測的效果,進而為運動目標檢測提供了一種新的解決方法。
技術領域
本發明應用于計算機視覺技術領域,是一種基于多尺度時空傳播層的運動目標檢測方法。
背景技術
運動目標檢測是一種二分類任務,把視頻的每一幀圖像的每個像素點分為前景或背景。它是視覺應用的基礎,在交通分析、擁擠度分析、物體追蹤、自動駕駛和異常情況檢測等視頻監測任務中都起到十分重要的作用。運動目標檢測需要克服多種不同噪聲對視頻的影響,如光線差異、動態背景、物體陰影、相機抖動、物體不規則運動等。目前,運動目標檢測算法主要分成兩類,一類是對背景進行建模的傳統算法,另一類則是利用神經網絡自主學習進行前景識別的深度學習算法。
傳統算法常對視頻背景進行建模以實現運動目標檢測。通常會通過利用如顏色、像素點強度、梯度、歷史像素點分布等低級特征對背景模型進行更新與維護。然而,由于低級特征易受到噪聲影響,因此傳統算法只適用于簡單場景。另外,傳統算法通常依賴人工調優,需要人為的持續干預以保證效果,因此無法具有較好的泛用性。
憑借深度學習對高級特征強大的提取能力與其較少人工干預的特性,基于深度學習的運動目標檢測的魯棒性通常更高,效果更好。且基于深度學習的算法可實現端對端的效果,因此不需要后續的建模過程與后處理。但是,目前基于深度學習的運動目標檢測大都依賴神經網絡已有的網絡層,對時間特征提取手段較為單一,缺乏靈活性。
發明內容
本發明是為了解決上述現有技術存在的不足之處,提出一種基于多尺度時空傳播層的運動目標檢測方法,以期能為解決現有的運動目標檢測對時空特征提取方法的單一、魯棒性差、只注重局部信息等問題,從而能快速準確檢測在不同挑戰場景下的前景目標,并加強對前景檢測的效果,進而為運動目標檢測提供了一種新的解決方法。
本發明為達到上述發明目的,采用如下技術方案:
本發明一種基于多尺度時空傳播層的運動目標檢測方法的特點包括如下步驟:
步驟1、獲取視頻數據集以及像素級標簽;
步驟1.1、選取帶有像素級標簽的視頻圖像數據,并分成N段多幀的短視頻序列,并對N段多幀的短視頻序列中所有像素點進行歸一化,得到歸一化后的訓練樣本集,記為S={S1,S2,...,So,...,SN},So表示第o段歸一化后的短視頻序列,且So={Fo1,Fo2,...,Fon},Fon為第i段歸一化后的短視頻序列中第n幀圖像;o∈[1,N];
步驟2、建立搭載多尺度時空傳播層的網絡模型,所述網絡模型由空間特征提取模塊、時空特征融合模塊、特征解碼模塊以及一個類Unet模型組成;
步驟2.1、初始化權重值:對網絡模型的卷積層及BatchNormalization層進行參數初始化;
步驟2.2、所述空間特征提取模塊由VGG模型的前13層,且每層各連接一個BatchNormalization層所組成;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010895232.3/2.html,轉載請聲明來源鉆瓜專利網。





