[發明專利]視頻文件中特定對象檢測方法、裝置及計算設備在審
| 申請號: | 201711071544.7 | 申請日: | 2017-11-03 |
| 公開(公告)號: | CN107729873A | 公開(公告)日: | 2018-02-23 |
| 發明(設計)人: | 張康;陳強 | 申請(專利權)人: | 北京奇虎科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 北京市浩天知識產權代理事務所(普通合伙)11276 | 代理人: | 宋菲,陳翠 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻文件 特定 對象 檢測 方法 裝置 計算 設備 | ||
技術領域
本發明涉及視頻處理技術領域,具體涉及一種視頻文件中特定對象檢測方法、裝置、計算設備及計算機存儲介質。
背景技術
目前的互聯網提供了海量的視頻數據,因此對于用戶來講,如何能夠檢索到自己感興趣的視頻文件成為比較困難的事情,往往需要一一觀看視頻文件,才能夠確定。以某明星的粉絲為例,粉絲僅關注有該明星的視頻文件,就需要粉絲一一觀看視頻,浪費粉絲時間;而對于需要進行安防監控的公司來說,其往往需要監控是否有其他陌生人出入公司,現有技術中,采用了人工審核方法來確定視頻文件中是否包含特定對象,采用人工審核方法需要投入大量的人力,增加了審核成本,而且審核效率低;雖然現有技術中還有一些其他自動檢測方法,但是檢測的準確率低,并不能滿足檢測需求。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的視頻文件中特定對象檢測方法、視頻文件中特定對象檢測裝置、計算設備及計算機存儲介質。
根據本發明的一個方面,提供了一種視頻文件中特定對象檢測方法,方法基于經過訓練的特征抽取網絡、以及經過訓練的特定對象檢測模型執行,方法包括:
獲取待檢測視頻文件;
將待檢測視頻文件輸入至特征抽取網絡,得到與待檢測視頻文件對應的預設維度的文件特征;
基于預設維度的文件特征利用特定對象檢測模型進行對象檢測,得到待檢測視頻文件是否包含特定對象的檢測結果。
可選地,將待檢測視頻文件輸入至特征抽取網絡,得到與待檢測視頻文件對應的預設維度的文件特征進一步包括:
對待檢測視頻文件進行解碼處理,得到多個視頻幀;
針對多個視頻幀的每一視頻幀,將視頻幀輸入至特征抽取網絡,得到與該視頻幀對應的預設維度的幀特征;
利用預設算法對多個視頻幀的幀特征進行運算處理,得到與待檢測視頻文件對應的預設維度的文件特征。
可選地,利用預設算法對多個視頻幀的幀特征進行運算處理,得到與待檢測視頻文件對應的預設維度的文件特征進一步包括:
計算多個視頻幀的幀特征的特征值的平均值,得到與待檢測視頻文件對應的預設維度的文件特征。
可選地,在對待檢測視頻文件進行解碼處理,得到多個視頻幀之后,方法還包括:
利用預設抽幀策略從多個視頻幀中抽取至少一個視頻幀。
可選地,特定對象檢測模型訓練所用的樣本包含:樣本庫存儲的多個視頻文件樣本以及與視頻文件樣本對應的是否包含特定對象的標注結果;其中多個視頻文件樣本包含多個視頻文件正樣本和多個視頻文件負樣本,視頻文件正樣本為包含特定對象的視頻文件樣本,視頻文件負樣本為不包含特定對象的視頻文件樣本。
可選地,特定對象檢測模型的訓練過程包括:
將視頻文件樣本輸入至特征抽取網絡,得到與視頻文件樣本對應的預設維度的文件特征;
將文件特征輸入至特定對象檢測模型進行訓練,得到視頻文件樣本是否包含特定對象的檢測結果;
根據檢測結果與標注結果之間的損失,得到特定對象檢測模型損失函數,根據特定對象檢測模型損失函數更新特定對象檢測模型的權重參數;
迭代執行上述步驟,直至滿足預定收斂條件。
可選地,預定收斂條件包括:迭代次數達到預設迭代次數;和/或,特定對象檢測模型損失函數的輸出值小于預設閾值。
根據本發明的另一方面,提供了一種視頻文件中特定對象檢測裝置,裝置基于經過訓練的特征抽取網絡、以及經過訓練的特定對象檢測模型執行,裝置包括:
獲取模塊,適于獲取待檢測視頻文件;
特征抽取模塊,適于將待檢測視頻文件輸入至特征抽取網絡,得到與待檢測視頻文件對應的預設維度的文件特征;
對象檢測模塊,適于基于預設維度的文件特征利用特定對象檢測模型進行對象檢測,得到待檢測視頻文件是否包含特定對象的檢測結果。
可選地,特征抽取模塊進一步包括:
解碼處理單元,適于對待檢測視頻文件進行解碼處理,得到多個視頻幀;
第一特征抽取單元,適于針對多個視頻幀的每一視頻幀,將視頻幀輸入至特征抽取網絡,得到與該視頻幀對應的預設維度的幀特征;
運算處理單元,適于利用預設算法對多個視頻幀的幀特征進行運算處理,得到與待檢測視頻文件對應的預設維度的文件特征。
可選地,運算處理單元進一步適于:計算多個視頻幀的幀特征的特征值的平均值,得到與待檢測視頻文件對應的預設維度的文件特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司,未經北京奇虎科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711071544.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種機箱的控溫系統
- 下一篇:一種變壓機采用的降溫機箱





