[發明專利]一種區域視頻人體動作行為實時識別方法在審
| 申請號: | 201910513640.5 | 申請日: | 2019-06-14 |
| 公開(公告)號: | CN110348312A | 公開(公告)日: | 2019-10-18 |
| 發明(設計)人: | 涂志剛;楊初喜 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多目標檢測 區域視頻 檢測結果 人體動作 實時識別 網絡模型 異常信息 讀取 訓練數據集 測試視頻 多幀視頻 監控設備 快速識別 情況信息 人員入侵 事前預警 圖像輸入 物體目標 訓練過程 訓練數據 優化目標 有效實現 真實邊界 矩估計 視頻流 幀圖像 自適應 觸發 超時 構建 優化 警報 標簽 取證 圖像 返回 檢測 網絡 | ||
本發明提出了一種區域視頻人體動作行為實時識別方法。使用opencv技術讀取實時rtsp視頻流,獲取多幀視頻圖像,對每幀圖像標出檢測物體目標的真實邊界框及類別作為標簽,構建訓練數據;將訓練數據集輸入到多目標檢測網絡進行訓練,以目標損失最小為優化目標,通過使用自適應矩估計優化方法得到優化后超參數,通過以上訓練過程就完成了訓練后的多目標檢測網絡模型;將測試視頻圖像輸入訓練后的多目標檢測網絡模型獲得檢測結果,根據檢測結果返回異常信息,由此異常信息觸發警報。本發明優點在于,可以準確快速識別并掌握監控設備區域視頻內的情況信息(人員入侵、進入、離崗、超時談話和人員密度),有效實現事前預警、事中處理、事后及時取證的功能。
技術領域
本發明涉及視頻監控設備中目標人員檢測的技術,涉及一種區域視頻人體動作行為實時識別方法。
背景技術
在視頻監督領域,準確而快速的對監控視頻進行智能分析一直是一個技術難點。視頻監督即借助計算機強大的數據處理能力過濾掉視頻畫面無用的或干擾信息,自動識別并掌握不同人物的動作、行為特性,抽取視頻源中關鍵有用信息,快速準確的定位事故現場,判斷監控畫面中的異常情況,并以最快和最佳的方式發出警報或觸發其它動作,從而有效實現事前預警、事中處理、事后及時取證的功能。與一般的分類問題不同,在視頻監督過程中,由于場景的多變,場景中人、事、物的多變,以及視覺任務的多變,導致視頻督察的難度相當的大,是一個亟需解決的問題。
視頻監督過程中,如果畫面中在某一時刻或者某一時間段出現了不符合常理的動作、行為,則判定為該時刻或時間段的工作區域出現問題,這稱為全局監督。而在全局監督的基礎上,對于同一個畫面會同時出現不同事件的情況,不僅監測出是否有異常動作、行為發生,而且粗略計算出事件的位置,稱為局部監督。本發明中對人員入侵、超時審訊和人員密度的監督屬于全局監督,人員進入和人員離崗則屬于局部監督。
視頻監督的主要目的是對視頻中的畫面進行連續的監測,判斷監控畫面中的異常情況,快速準確的定位不符合規范的動作、行為的位置,并以最快和最佳的方式發出警報。由于需要進行快速準確的提示和預警,因此對算法的計算速度和準確度要求很高。
發明內容
為了解決上述技術問題,本發明提出了一種區域視頻人體動作行為實時識別方法。當輸入一個視頻流時,通過opencv技術將視頻流提取成多個視頻幀圖像,針對輸入的視頻幀圖像獲取多尺度特征圖,同時在不同的特征圖上面進行預測,在不同的特征層的特征圖上的每個像素點同時獲取6個不同的默認候選框,將其與真實的目標邊界框進行匹配。然后將匹配成功的候選框結合起來,通過非極大值抑制算法(NMS)得到最具代表性的結果,以加快目標檢測的效率。
本發明提出一種區域視頻人體動作行為實時識別方法,可以快速的準確的對視頻進行監督,適用于公共場所、公司家庭等多種應用場景,可以根據具體的需求進行相應的調整,其特征在于,包括以下步驟:
步驟1:使用opencv技術讀取實時rtsp視頻流,獲取多幀視頻圖像,對每幀圖像標出檢測物體的目標的真實邊界框及類別作為標簽,以構建訓練數據;
步驟2:將訓練數據集輸入到多目標檢測網絡模型中進行訓練,以目標損失最小為優化目標,通過使用自適應矩估計優化方法得到優化后超參數,通過以上訓練過程就完成了訓練后的多目標檢測網絡模型;
步驟3:將測試視頻圖像輸入訓練后的多目標檢測網絡模型獲得檢測結果,根據檢測結果返回異常信息,由此異常信息觸發警報;
作為優選,步驟1中所述多幀圖像為:
datai,i∈[1,K]
其中,K為視頻流中圖像幀的數量;
第i幀圖像u行v列像素為:
datai(u,v),u∈[1,H],v∈[1,W]
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910513640.5/2.html,轉載請聲明來源鉆瓜專利網。





