[發明專利]一種基于深度學習的動態場景異物入侵檢測方法有效
| 申請號: | 202110049881.6 | 申請日: | 2021-01-14 |
| 公開(公告)號: | CN112766137B | 公開(公告)日: | 2023-02-10 |
| 發明(設計)人: | 謝巍;盧永輝;許練濠;周延;吳偉林 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V10/82;G06V10/26;G06N3/04;G06N3/08 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 鄭浦娟 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 動態 場景 異物 入侵 檢測 方法 | ||
1.一種基于深度學習的動態場景異物入侵檢測方法,其特征在于,包括如下步驟:
S1、利用監控設備采集所監控場景的RGB圖像幀;
S2、利用訓練好的目標分割模型對步驟S1采集的單幀RGB圖像中的目標區域進行分割,獲取目標區域二值化掩膜結果;
目標分割模型的基本結構包括:基本卷積層、最大池化層、上采樣層和級聯結構;
目標分割模型的主干網絡由編碼器和解碼器構成,編碼器包含依次連接的4個第一網絡單元,解碼器包含依次連接的4個第二網絡單元;
其中,每個第一網絡單元包括依次連接的2個基本卷積層和最大池化層,2個卷積層分別為第一基本卷積層、第二基本卷積層;每個第二網絡單元包括依次連接的上采樣層和2個基本卷積層,2個卷積層分別為第三基本卷積層和第四基本卷積層;
按照網絡連接順序,第一個第一網絡單元的第二基本卷積層與第四個第二網絡單元的上采樣層通過級聯結構連接至第四個第二網絡單元的第三基本卷積層;
第二個第一網絡單元的第二基本卷積層與第三個第二網絡單元的上采樣層通過級聯結構連接至第三個第二網絡單元的第三基本卷積層;
第三個第一網絡單元的第二基本卷積層與第二個第二網絡單元的上采樣層通過級聯結構連接至第二個第二網絡單元的第三基本卷積層;
第四個第一網絡單元的第二基本卷積層與第一個第二網絡單元的上采樣層通過級聯結構連接至第一個第二網絡單元的第三基本卷積層;第四個第一網絡單元的最大池化層通過基本卷積層連接第一個第二網絡單元的上采樣層;
利用訓練好的目標檢測模型對步驟S1采集的單幀RGB圖像中的異物目標進行檢測,獲取異物目標的類別和位置信息;
S3、根據目標區域二值化掩膜和異物目標位置信息,計算出異物目標的位置邊界框內目標區域像素占比P;
S4、根據計算得到的目標區域像素占比P和給定閾值T的大小關系,判斷異物目標的入侵狀態;
S5、根據異物目標的類別信息,判定異物目標的入侵等級;
S6、根據異物目標的入侵狀態和等級,發出對應的安全預警。
2.根據權利要求1所述的動態場景異物入侵檢測方法,其特征在于,在步驟S1中,利用監控設備采集到RGB圖像幀之后,還將RGB圖像幀的高寬比調整為1:2;
在步驟S2中,以高寬比為1:2的單通道灰度圖作為目標分割模型的輸入,目標分割模型的輸出為二值化掩膜,其為一個二維數組,尺寸與輸入圖片相同,數組中的每個元素的值為0或1,0表示非目標區域像素,1表示目標區域像素;
以高寬比為1:2的三通道RGB彩色圖作為目標檢測模型的輸入,目標檢測模型的輸出為含有異物目標的類別和位置信息的特征圖。
3.根據權利要求1所述的動態場景異物入侵檢測方法,其特征在于,目標分割模型和目標檢測模型均為卷積神經網絡,目標分割模型的基礎網絡采用UNET,目標檢測模型的基礎網絡結構采用YOLOv3。
4.根據權利要求1所述的動態場景異物入侵檢測方法,其特征在于,基本卷積層包括依次連接的卷積層、批正則化層和ReLU激活函數層;最大池化層采用的實現方式為核尺寸和步長均為2的最大池化操作;上采樣層采用的上采樣實現方式為轉置卷積;級聯結構用于在通道維度上對輸入進行疊加操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110049881.6/1.html,轉載請聲明來源鉆瓜專利網。





