[發明專利]基于監控視頻的非法遛狗事件檢測方法、裝置有效
| 申請號: | 202110492720.4 | 申請日: | 2021-05-07 |
| 公開(公告)號: | CN112906678B | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 楊帆;馮帥;劉利卉;胡建國 | 申請(專利權)人: | 南京甄視智能科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京德崇智捷知識產權代理有限公司 11467 | 代理人: | 楊楠 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 監控 視頻 非法 事件 檢測 方法 裝置 | ||
1.一種基于監控視頻的非法遛狗事件檢測方法,其特征在于,包括以下步驟:
步驟A、對監控視頻的圖像幀進行狗和人的檢測,如圖像幀中沒有檢測到狗,則判斷“狀態正常”并返回;如果圖像幀中只有狗沒有人,則判斷“狗未拴繩”并返回;否則,進入步驟B;
步驟B、估算圖像幀中人與狗之間的距離并判斷是否超過預設距離閾值,如是,則判斷“狗未拴繩”并返回;否則,進入步驟C;
步驟C、從圖像幀中截取包含狗的圖像并輸入狗拴繩識別模型,如狗拴繩識別模型的輸出為“狗已拴繩”或“狗未拴繩”,則將結果輸出并返回;否則,進入步驟D;所述狗拴繩識別模型為預先訓練好的卷積神經網絡模型,其輸入為含有狗的圖像,其輸出為“狗已拴繩”、“狗未拴繩”及“不確定”這三個類別;所述從圖像幀中截取的包含狗的圖像具體為第一感興趣區域圖像和第二感興趣區域圖像,第一感興趣區域圖像為狗的檢測框圖像,第二感興趣區域圖像為對狗的檢測框圖像進行擴邊所得到的圖像;所述卷積神經網絡模型具有兩個訓練樣本輸入分支,第一個分支用于對第一感興趣區域圖像先進行若干次卷積,然后沿卷積通道方向池化,最后將其歸一化指數處理為注意力特征圖;第二個分支用于對第二感興趣區域圖像先進行若干次卷積,得到與注意力特征圖的尺度大小相同的多通道特征圖,并用注意力特征圖分別與該多通道特征圖的每個通道特征圖相乘,然后對所得結果進行至少一次卷積后依次進行池化、線性化及歸一化指數處理;第一個分支使用包含小幅度旋轉和視角變換在內的數據擴增方式訓練,第二個分支使用不包含小幅度旋轉和視角變換的數據擴增方式訓練;
步驟D、從圖像幀中找出距離狗最近的k個人,對每個人截取出同時包含狗和這個人的最大檢測框,k為大于0的自然數;將所得到的k個檢測框圖像輸入人狗關系識別模型,并根據人狗關系識別模型的輸出判斷“狗已拴繩”或者“狗未拴繩”;所述人狗關系識別模型為預先訓練好的神經網絡模型,其輸入為同時包含狗和人的圖片,其輸出為“狗已拴繩”或者“狗未拴繩”這兩個類別。
2.如權利要求1所述基于監控視頻的非法遛狗事件檢測方法,其特征在于,所述卷積神經網絡模型為可重構卷積網絡模型。
3.如權利要求1所述基于監控視頻的非法遛狗事件檢測方法,其特征在于,所述對狗的檢測框圖像進行擴邊具體是指:對狗的檢測框圖像的上邊和左、右兩邊進行擴邊。
4.如權利要求1~3任一項所述基于監控視頻的非法遛狗事件檢測方法,其特征在于,所述擴邊的比例為15%-20%。
5.如權利要求1所述基于監控視頻的非法遛狗事件檢測方法,其特征在于,所述人狗關系識別模型由前端的局部和初步特征提取模塊以及后端的全局人狗關系注意力模塊組成;所述局部和初步特征提取模塊用于對輸入圖像進行若干次卷積,所得到的特征圖作為全局人狗關系注意力模塊的輸入;所述全局人狗關系注意力模塊為改進的Vision Transformer模型,其對所輸入的特征圖進行有重疊的分割。
6.如權利要求1所述基于監控視頻的非法遛狗事件檢測方法,其特征在于,用以下方法估算圖像幀中人與狗之間的距離:用人與狗之間的像素水平距離除以人檢測框的寬度,再乘以基準人體寬度;所述基準人體寬度的取值為0.25米~0.5米。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京甄視智能科技有限公司,未經南京甄視智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110492720.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于位圖的考勤標識算法
- 下一篇:一種真空精密鑄造模組自動化轉運系統





