[發(fā)明專利]低畫質視頻中的小目標實時識別方法在審
| 申請?zhí)枺?/td> | 201910479019.1 | 申請日: | 2019-06-03 |
| 公開(公告)號: | CN112036214A | 公開(公告)日: | 2020-12-04 |
| 發(fā)明(設計)人: | 張昭智 | 申請(專利權)人: | 上海湃道智能科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 畫質 視頻 中的 目標 實時 識別 方法 | ||
本發(fā)明提供了低畫質視頻中的小目標實時識別方法,小目標和大目標具有必然的相對位置關系,小目標具有標準狀態(tài)和非標準狀態(tài);抽取視頻中一定數量的圖片作為數據集進行標注;數據集標注為小目標標準狀態(tài)和小目標非標準狀態(tài)兩個類別,每個類別對應兩個矩形框,標準狀態(tài)下第一個框是大目標,第二個框是小目標的標準狀態(tài);非標準狀態(tài)下第一個框是大目標,第二個框是小目標的非標準狀態(tài);利用數據集作為目標檢測算法訓練參考;利用目標檢測算法對視頻進行目標狀態(tài)識別。本發(fā)明具有較高的檢測準確率。
技術領域
本發(fā)明涉及計算機視覺領域,尤其是一種在低畫質視頻中的小目標實時識別方法。
背景技術
利用計算機視覺進行目標檢測的任務是從圖像中解析出可供計算機理解的信息,在實際檢測過程中,除了需要得到圖片中目標的類別信息以外,還需要得到目標的位置信息。目前基于深度學習的目標檢測算法主要分為基于分類的目標檢測算法和基于回歸的目標檢測算法兩個大類。
基于分類的目標檢測算法主要是將目標檢測過程分為兩個階段。第一個階段主要是選取候選區(qū)域,第二個階段則針對候選區(qū)域進行分類并進行位置調整,經過這兩個階段之后得到目標檢測結果。目前此方案的典型模型是2015年Ren S等人提出的更快的基于區(qū)域的卷積神經網絡算法(Faster R-CNN),用候選區(qū)域生成網絡(Regional ProposalNetworks,RPN)將目標檢測系統(tǒng)分為兩個模塊,第一個模塊是提取候選區(qū)域的深度全卷積網絡,第二個模塊使用基于區(qū)域提取的Faster R-CNN檢測器進行檢測。整個系統(tǒng)是一個單個的、統(tǒng)一的目標檢測網絡。Faster R-CNN算法框架如圖所示。首先將整張圖片作為輸入,經過卷積計算得到特征層,然后將卷積特征輸入到RPN網絡,得到候選框的特征信息;接著對候選框中提取出的特征,使用分類器判別是否屬于一個特定類;最后對屬于某一特征的候選框,用回歸器進一步調整其位置,整個網絡流程共享卷積神經網絡提取的特征信息。
在尺寸一定的卷積特征圖中,RPN網絡能夠生成具有多個尺寸的候選框,造成了目標尺寸可變以及固定感受野不一致的問題。如增加候選框數量,則又會導致算法檢測速度降低,難以滿足實際生產環(huán)境對于實時性的要求。
基于回歸的目標檢測算法將目標檢測過程簡化成一個具有統(tǒng)一性的端到端的回歸問題,從而只需要將圖片處理一次(對比多次選取候選區(qū)域分類),就可以同時得到檢測目標的位置和類別信息。與基于區(qū)域提取的兩階段模型不同,單階段方法通過完整的單次訓練就能實現特征共享。這類算法的典型代表有你只需要看一次(YouLook Only Once,YOLO)、SSD等。下面以SSD為例進行重點闡述。
2016年LiuW等提出SSD算法,將單個深度神經網絡應用到圖像目標檢測中。SSD算法框架如圖所示,其定位邊界框定義為一組在空間上離散的默認框,且對應于不同的長寬比與映射位置。在進行預測時,網絡會為每個默認框中的目標類別生成對應的概率分數,并調整默認框以實現與目標形狀的良好匹配。除此以外,網絡還對具有不同畫質的目標結合其多個特征映射作出完整預測,實現對多尺寸目標的檢測任務。
在SSD算法中,無候選區(qū)域時,區(qū)域回歸難度較大,容易出現較難收斂的問題;SSD不同層的特征圖都作為分類網絡的獨立輸入,導致同一個物體被不同大小的框同時檢測,造成了重復運算;由于小目標對應于特征圖中很小的區(qū)域,無法得到充分訓練,因此SSD對于小目標的檢測效果依然不理想。
在利用現有計算機視覺技術對低畫質視頻中的小目標進行檢測識別時,由于目標較小,導致如果使用傳統(tǒng)的深度學習方法得出的檢測準確率較低。
因此急需解決現有技術在低畫質視頻中對小目標進行實時檢測識別的問題。
發(fā)明內容
本發(fā)明的目的在于解決在低畫質視頻中對小目標進行實時檢測識別的問題。在利用現有計算機視覺技術進行改進,實現對低畫質視頻中的小目標進行準確率較高的檢測識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海湃道智能科技有限公司,未經上海湃道智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910479019.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:旋風分離器
- 下一篇:一種錐形取栓支架及血栓取出裝置





