[發明專利]一種視頻流實時行人檢測方法在審
| 申請號: | 201910859779.5 | 申請日: | 2019-09-11 |
| 公開(公告)號: | CN110555425A | 公開(公告)日: | 2019-12-10 |
| 發明(設計)人: | 張春月;史小宏;易典;徐浩 | 申請(專利權)人: | 上海海事大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 31323 上海元好知識產權代理有限公司 | 代理人: | 張妍;周乃鑫 |
| 地址: | 201306 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 分類概率 邊界框 二值化 卷積 分類誤差 檢測結果 快速檢測 損失函數 特征提取 行人檢測 坐標誤差 不敏感 計算量 可信度 視頻流 回歸 檢測 準確率 低維 尺度 輸出 融合 | ||
1.一種視頻流實時行人檢測方法,其特征在于,包含以下步驟:
步驟S1、對卷積神經網絡的輸入和權值進行二值化,使用卷積神經網絡提取行人的卷積特征;
步驟S2、融合卷積神經征,輸出不同尺度的回歸邊界和分類概率;
步驟S3、根據回歸邊界和分類概率,使用包含了分類誤差、邊界框坐標誤差和邊界框內目標可信度誤差的損失函數對二值化后的卷積神經網絡進行訓練,得到最終的檢測結果。
2.如權利要求1所述的視頻流實時行人檢測方法,其特征在于,所述的卷積神經網絡包含5類殘差塊,每類殘差塊跨2層連接,每類殘差塊包含2個卷積層和一個短連接,每類的數量分別為:1,2,8,8,4,最后輸出1024維8×8的卷積特征。
3.如權利要求2所述的視頻流實時行人檢測方法,其特征在于,所述的對卷積神經網絡的輸入和權值進行二值化的方法包含以下步驟:
步驟S1-1、卷積神經網絡權值二值化;
引入標量參數α,使得W≈α×B,其中,W為原始權值,B為二值化的權值,B=sign(W),表示對原始權值進行L1歸一化之后除n;
步驟S1-2、卷積神經網絡輸入二值化;
將輸入在通道維度計算歸一化得到A,用w×h大小的卷積核k對A進行卷積得到K,k=1/wh,之后只需要將Sign(I)與Sign(W)進行卷積,再乘K和α即可;
步驟S1-3、使用來替代二值化時的梯度計算。
4.如權利要求3所述的視頻流實時行人檢測方法,其特征在于,所述的步驟S2具體包含以下步驟:
步驟S2.1、將卷積神經網絡中最后一層的輸出卷積特征進行softmax回歸,得到第一個回歸邊界和分類概率,作為第一個融合尺度特征;
步驟S2.2、將來自卷積神經網絡中倒數第1類殘差塊的最后一組的卷積特征與卷積神經網絡的最后一層的輸出卷積特征進行2倍上采樣融合,然后進行4次卷積后,得到第二個回歸邊界和分類概率,作為第二個融合尺度特征;
步驟S2.3、將來自卷積神經網絡中倒數第2類殘差塊的最后一組的卷積特征與第二個融合尺度特征進行2倍上采樣的融合,然后進行4次卷積后,得到第三個回歸邊界和分類概率,作為第三個融合尺度特征。
5.如權利要求4所述的視頻流實時行人檢測方法,其特征在于,步驟S3中,所述的損失函數L為:
其中,為邊界框坐標誤差損失函數,λcoord為坐標懲罰參數,表示單位格i,邊界框j中是否有目標存在,S為劃分的單元格數目,x,y,w,h分別為邊界框的中心坐標以及寬高,為邊界框內目標可信度誤差損失函數,c為該單元格出現目標概率,為分類誤差,p為單元格內每種類別的概率,表示是否有目標中心點落在單元格i上,classes為訓練中的種類參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海海事大學,未經上海海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910859779.5/1.html,轉載請聲明來源鉆瓜專利網。





