[發明專利]基于卷積神經網絡的視頻采集方法和視頻采集系統在審
| 申請號: | 202010632493.6 | 申請日: | 2020-07-02 |
| 公開(公告)號: | CN112001224A | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 王宇;宗文 | 申請(專利權)人: | 北京奧維視訊科技有限責任公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/08 |
| 代理公司: | 北京律和信知識產權代理事務所(普通合伙) 11446 | 代理人: | 郝文博 |
| 地址: | 100208 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 神經網絡 視頻 采集 方法 系統 | ||
本發明公開了一種基于卷積神經網絡的視頻采集方法,包括:S101:接收視頻采集裝置獲取的視頻;S102:通過卷積神經網絡模型,在所述視頻的視頻幀中提取關鍵部位;S103:根據所述關鍵部位的檢測信息和定位信息,調整所述視頻采集裝置的物理參數。
技術領域
本發明大致涉及視頻圖像處理領域,尤其涉及基于卷積神經網絡的視頻采集方法和視頻采集系統。
背景技術
視頻內容的目標檢測與跟蹤技術的目的是在一段視頻序列中檢測感興趣的目標(一般為運動目標)并對其沿時間軸進行定位,從而形成該目標的運動軌跡。目標檢測與跟蹤技術在不同領域得到了廣泛應用,例如智能視頻監控、自動駕駛、無人機導航、工業機器人等。
運動目標檢測的方法主要包括背景差分法、時間差分法以及光流場。這些方法都是基于空域的檢測方法。前兩種方法的計算復雜度低,實時性好,但都有其應用局限性,例如背景差分法在背景穩定性高的情況下效果比較好,但如果發生光照條件變化、天氣變化、攝像機抖動等情況,會產生目標檢測錯誤。時間差分法則在檢測的相關幀之間畫面變化不大的情況下效果比較好,光照條件的變化也會嚴重影響目標檢測的準確度。光流場的計算復雜度高,檢測精確度高于前兩種方法,但同樣不能解決光照條件變化的問題。
早期的運動目標跟蹤算法主要通過模板匹配在當前幀中尋找與待跟蹤目標最接近的候選目標,經典的算法包括卡爾曼濾波(Kalman Fiter)、均值濾波(Mean Shift)等。近年來,隨之深度學習(Deep Learning)理論的成熟與多種應用框架的日益完善,基于深度學習以及深度學習與相關濾波(Correlation Filter)的本質為分類器的目標跟蹤算法成為主流技術。
背景技術部分的內容僅僅是發明人所知曉的技術,并不當然代表本領域的現有技術。
發明內容
有鑒于現有技術的至少一個缺陷,本發明提供一種基于卷積神經網絡的視頻采集方法,包括:
S101:接收視頻采集裝置獲取的視頻;
S102:通過卷積神經網絡模型,在所述視頻的視頻幀中提取關鍵部位;
S103:根據所述關鍵部位的檢測信息和定位信息,調整所述視頻采集裝置的物理參數。
根據本發明的一個方面,所述的視頻采集方法還包括:通過以下步驟建立所述卷積神經網絡模型:
選擇模型和訓練框架;
建立標注所述關鍵部位的訓練集;
利用所述模型和訓練框架對所述訓練集進行訓練,輸出所述卷積神經網絡模型的模型拓撲和參數。
根據本發明的一個方面,所述模型包括R-CNN模型、Fast R-CNN模型、Faster R-CNN模型、Mask R-CNN模型中的一個,其中所述視頻采集方法還包括:
在所述視頻幀的預定區域中選擇多個方框,作為所述關鍵部位的檢測和定位信息的備選方案。
根據本發明的一個方面,所述步驟S102包括:通過所述卷積神經網絡模型,在所述視頻的多幀視頻幀中提取所述關鍵部位,
其中所述視頻采集方法還包括:當在預設數目的連續多幀中均檢測到同一關鍵部位時,且所述同一關鍵部位在所述連續多幀中的坐標差異和/或尺寸差異小于閾值時,判斷所述同一關鍵部位的檢測具有一致性,
其中所述步驟S103包括:當所有的同一關鍵部位的檢測具有一致性時,根據所述關鍵部位的檢測信息和定位信息,調整所述視頻采集裝置的物理參數。
根據本發明的一個方面,所述的視頻采集方法還包括:判斷不同的關鍵部位是否符合預設位置關系;當不同的關鍵部位符合預設位置關系時,確定所述關鍵部位的檢測正常;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奧維視訊科技有限責任公司,未經北京奧維視訊科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010632493.6/2.html,轉載請聲明來源鉆瓜專利網。





