[發明專利]一種實時的視頻目標檢測方法在審
| 申請號: | 201811588266.7 | 申請日: | 2018-12-25 |
| 公開(公告)號: | CN109685008A | 公開(公告)日: | 2019-04-26 |
| 發明(設計)人: | 柏正堯;蔣冬 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 昆明大百科專利事務所 53106 | 代理人: | 何健 |
| 地址: | 650500 云南省昆*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 視頻目標 上采樣 特征層 低層 卷積 預測 目標分類 目標位置 情況檢測 視頻監控 通道連接 圖像特征 第一層 算法 高層 應用 交通 網絡 | ||
1.一種實時的視頻目標檢測方法,其特征在于,通過低層卷積層與高層卷積層的連接提高對圖像特征的利用;然后,通過對第一層預測層進行上采樣操作,得到尺寸更大的特征層;最后,將得到的上采樣特征層與低層網絡進行通道連接,增加第二層預測,使得算法對目標的檢測更為精確;方法包括:
1)數據集來源于PASCAL VOC公共數據庫,該數據庫為圖像識別和分類提供了一整套標準化的數據集;
2)用層數更多的卷積神經網絡替代層數少的網絡,通過對特征的重復利用,使訓練的模型對物體的分類以及位置的預測更為精確;
3)通過卷積層的跨層連接,再通過上采樣操作增加預測層得到目標的分類及位置;
4)通過連接上采樣層和低層卷積層的特征得到了更為精確的目標分類和定位結果。
2.根據權利要求1所述的一種實時的視頻目標檢測方法,其特征在于,所述的目標為實時的視頻目標,將該實時的視頻目標檢測視為一個模式的轉化問題,即目標的分類為第一模式,目標的定位為第二模式;采用一個改進的卷積神經網絡模擬第一模式和第二模式之間的映射關系。
3.根據權利要求1所述的一種實時的視頻目標檢測方法,其特征在于,所述用層數更多的卷積神經網絡替代層數少的網絡是采用一個改進的卷積神經網絡模擬第一模式和第二模式之間的映射關系;用損失函數表示當前神經網絡分類及定位結果圖與標準圖之間的誤差;在訓練過程中反復迭代誤差損失函數,當損失函數盡可能小時,訓練得到模型已能夠有效提取對視頻目標的分類與定位的映射規律,通過所學到的規律準確檢測所述實時的視頻目標;整個實時的視頻目標檢測過程由目標分類和目標定位兩部分組成。
4.根據權利要求1或2或3所述的一種實時的視頻目標檢測方法,其特征在于,基于密集連接的所述卷積神經網絡架構設計了一個能夠有效提取圖像特征的神經網絡;該網絡包含特征的提取和特征連接兩部分;該網絡的思想是連接低層的卷積層,提高對特征的重復利用,并在第一層預測層之后增加上采樣操作,連接低層特征,提高對特征的利用,在大尺度上進行目標的分類及定位使目標的檢測更為精確。
5.根據權利要求1或2或3所述的一種實時的視頻目標檢測方法,其特征在于,采用的所述卷積神經網絡是一種密集連接架構,每一層卷積層都接收來自前面所有卷積層的輸出,每一塊中都有兩層卷積層,其卷積核大小分別為1x1、3x3,且每個卷積層后都有一個激活函數leaky-ReLU;在連續幾個塊之后是一個大小為3x3,步長為2的卷積層,作用是降低圖像分辨率,得到圖像的深度特征;特征復用就是進行通道合并操作,使低層特征一直被使用,提高特征利用率,在上采樣后將對于大小相同的低層特征進行通道合并,提升第二次預測的結果;神經網絡的輸入使需檢測的圖像,輸出則是對圖像中目標的分類及定位。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811588266.7/1.html,轉載請聲明來源鉆瓜專利網。





