[發明專利]一種區域視頻人體動作行為實時識別方法在審
| 申請號: | 201910513640.5 | 申請日: | 2019-06-14 |
| 公開(公告)號: | CN110348312A | 公開(公告)日: | 2019-10-18 |
| 發明(設計)人: | 涂志剛;楊初喜 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多目標檢測 區域視頻 檢測結果 人體動作 實時識別 網絡模型 異常信息 讀取 訓練數據集 測試視頻 多幀視頻 監控設備 快速識別 情況信息 人員入侵 事前預警 圖像輸入 物體目標 訓練過程 訓練數據 優化目標 有效實現 真實邊界 矩估計 視頻流 幀圖像 自適應 觸發 超時 構建 優化 警報 標簽 取證 圖像 返回 檢測 網絡 | ||
1.一種區域視頻人體動作行為實時識別方法,其特征在于,包括以下步驟:
步驟1:使用opencv技術讀取實時rtsp視頻流,獲取多幀視頻圖像,對每幀圖像標出檢測物體的目標的真實邊界框及類別作為標簽,以構建訓練數據;
步驟2:將訓練數據集輸入到多目標檢測網絡模型中進行訓練,以目標損失最小為優化目標,通過使用自適應矩估計優化方法得到優化后超參數,通過以上訓練過程就完成了訓練后的多目標檢測網絡模型;
步驟3:將測試視頻圖像輸入訓練后的多目標檢測網絡模型獲得檢測結果,根據檢測結果返回異常信息,由此異常信息觸發警報。
2.根據權利要求1所述的區域視頻人體動作行為實時識別方法,其特征在于:步驟1中所述多幀圖像為:
datai,i∈[1,K]
其中,K為視頻流中圖像幀的數量;
第i幀圖像u行v列像素為:
datai(u,v),u∈[1,H],v∈[1,W]
其中,H為一幀圖像中行的數量,W為一幀圖像中列的數量;
對對每幀圖像標出檢測物體的目標的真實框及類別具體為:
目標的真實邊界框為:truth boxj=[txj,tyj,twj,thj],j∈[1,K]
其中,txj表示第j幀圖像中目標物的真實邊界框在左上角的像素橫坐標,tyj表示第j幀圖像中目標物的真實邊界框在左上角的像素縱坐標,twj表示第j幀圖像中目標物的真實邊界框的寬度,thj表示第j幀圖像中目標物的真實邊界框的高度;
類別為cati:cati∈[1,C],C表示總的類別數量;
步驟1中所述標簽為:
labeli={truth boxi,cati},i∈[1,K]
其中,labeli第i幀圖像的標簽;
步驟1中所述訓練數據集為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910513640.5/1.html,轉載請聲明來源鉆瓜專利網。





