[發明專利]一種視頻處理方法及裝置有效
| 申請號: | 202010066598.X | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111222493B | 公開(公告)日: | 2023-07-28 |
| 發明(設計)人: | 陳富強;李健;武衛東 | 申請(專利權)人: | 北京捷通華聲科技股份有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V40/20;G06V10/46;G06V10/774 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100193 北京市海淀區東北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 處理 方法 裝置 | ||
1.一種視頻處理方法,其特征在于,所述方法包括:
從待處理視頻中獲取M幀視頻圖像;所述M為正整數;
對每幀所述視頻圖像進行人體姿態檢測,確定每幀所述視頻圖像中包含的每個人物的人體姿態;
確定所述人物在至少P幀視頻圖像中的人體姿態均滿足第一預設條件;所述第一預設條件是根據人體在抽煙狀態下的姿態特征確定的;所述第一預設條件為人物的手部與嘴部之間的像素個數與人物頭部所占的像素個數的比值小于預設閾值;
若所述人物在至少P幀視頻圖像中的人體姿態均滿足第一預設條件,則對于每個所述人物,根據所述人物在每幀所述視頻圖像中的人體姿態,提取所述人物在每幀所述視頻圖像中對應的人體圖像區域,得到N幀人體圖像區域;所述N為正整數;
將所述N幀人體圖像區域組成的視頻作為備選視頻,并輸入預訓練的動作分類模型中,以確定所述備選視頻對應的動作類別;
若所述備選視頻對應的動作類別為抽煙,則將所述備選視頻對應的人物確定為抽煙人物。
2.根據權利要求1所述的方法,其特征在于,所述確定所述人物在至少P幀視頻圖像中的人體姿態均滿足第一預設條件,包括:
對于每幀所述視頻圖像,根據所述人物在所述視頻圖像中的人體姿態,確定所述人物的手部與嘴部之間的第一像素個數以及所述人物頭部所占的第二像素個數;
若所述第一像素個數與所述第二像素個數的比值小于預設閾值,則確定所述人物在至少P幀視頻圖像中的人體姿態均滿足第一預設條件。
3.根據權利要求1所述的方法,其特征在于,所述對每幀所述視頻圖像進行人體姿態檢測,確定每幀所述視頻圖像中包含的每個人物的人體姿態的步驟,包括:
按照每幀所述視頻圖像在所述待處理視頻中的圖像時序依次執行以下操作:
利用預設的人體姿態檢測算法對所述視頻圖像進行檢測,得到所述視頻圖像中包含的人物的人體姿態;所述人體姿態包括人體關鍵點;
根據預設的關鍵點跟蹤算法,對所述視頻圖像中人物的人體姿態進行關鍵點跟蹤,以確定所述視頻圖像中人物在下一幀視頻圖像中的人體姿態;
利用所述人體姿態檢測算法對所述下一幀視頻圖像中的其他區域進行檢測,以確定所述下一幀視頻圖像中包含的其他人物的人體姿態,得到所述下一幀視頻圖像中包含的每個人物的人體姿態;所述其他區域為所述下一幀視頻圖像中除已檢測到的人體姿態對應的區域外的區域。
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
對于每個人物,為所述人物在每幀所述視頻圖像中的人體姿態,標記所述人物的人物ID;其中,不同人物對應的人物ID不同;
相應地,所述提取所述人物在每幀所述視頻圖像中對應的人體圖像區域,得到N幀人體圖像區域,包括:
從每幀所述視頻圖像中所述人物的人物ID標記的位置,提取預設尺寸大小的區域,得到所述人物在每幀所述視頻圖像中對應的人體圖像區域。
5.根據權利要求1至4任一所述的方法,其特征在于,所述動作分類模型是基于正樣本以及負樣本訓練得到的;
所述正樣本為包含抽煙動作的視頻;所述負樣本為包含類抽煙動作的視頻;
所述類抽煙動作的是與抽煙動作的相似度大于預設相似度閾值的非抽煙動作。
6.根據權利要求1所述的方法,其特征在于,所述將所述備選視頻對應的人物確定為抽煙人物之后,所述方法還包括:
檢測所述抽煙人物在所述待處理視頻中所處位置的位置信息;
向后臺監控終端發送報警信息;所述報警信息中至少包含所述位置信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京捷通華聲科技股份有限公司,未經北京捷通華聲科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010066598.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種汽車齒輪用粉末冶金硬質合金材料
- 下一篇:一種非接觸式的三相電流檢測系統





