[發明專利]基于多列卷積神經網絡的單張圖像人群計數算法有效
| 申請號: | 201511030645.0 | 申請日: | 2015-12-31 |
| 公開(公告)號: | CN105528589B | 公開(公告)日: | 2019-01-01 |
| 發明(設計)人: | 高盛華;張營營;馬毅 | 申請(專利權)人: | 上海科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩 |
| 地址: | 201210 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 神經網絡 單張 圖像 人群 計數 算法 | ||
本發明提供了一種基于多列卷積神經網絡的單張圖像人群計數算法,其中的多列卷積神經網絡有三個子網絡,每個子網絡用到卷積核的大小不同,每個子網絡的輸入為同一張圖像,在經過四次卷積和兩次池化后,三個子網絡輸出的特征圖在“通道”維度上鏈接在一起,再用一個1×1的核卷積得到人群的密度圖。本發明得到的人群密度優于現有算法。
技術領域
本發明涉及一種依據單張圖像進行精確的人群計數或者人群密度估計的算法。
背景技術
現有人群計數算法存在對圖像分割技術依賴性比較大、計數規模較小、輸入圖片大小固定等諸多限制,很多算法對于人數變化很大,或者背景復雜的圖像的計數精度很低。如今,室外廣場、街道基本都配備了攝像頭,但是人群信息處理還沒有得到有效應用,因此精確的人群計數或者人群密度估計算法對于監控中人群異常事件檢測具有重要意義。
發明內容
本發明的目的是提供一種依據單張圖像進行精確的人群計數或者人群密度估計的算法。
為了達到上述目的,本發明的技術方案是提供了一種基于多列卷積神經網絡的單張圖像人群計數算法,包括以下步驟:
建立多列卷積神經網絡,利用樣本集對該多列卷積神經網絡進行訓練,得到待學習參數Θ的估計,使得通過該多列卷積神經網絡得到的樣本集中任意輸入圖像x的人群密度估計圖F(x;Θ)與該輸入圖像x的實際人群密度圖M(x)間的歐式距離最小,其特征在于:
所述多列卷積神經網絡包括子網絡一、子網絡二、子網絡三,同一張輸入圖像x輸入子網絡一、子網絡二、子網絡三后均經過四次卷積和兩次池化得到三組不同的特征圖,子網絡一的卷積的卷積核大小為N1×N1,子網絡二的卷積的卷積核大小為N2×N2,子網絡三的卷積的卷積核大小為N3×N3,N1>N2>N3,三組特征圖在通道維度上鏈接在一起,再用一個1×1的核卷積得到人群的估計密度圖,該多列卷積神經網絡的損失函數是多列卷積神經網絡的第i幅輸入圖像xi的人群密度估計圖F(xi;Θ)和多列卷積神經網絡的第i幅輸入圖像xi的實際人群密度圖M(xi)之間的歐氏距離L(Θ),式中,N為輸入多列卷積神經網絡的圖像數量,為多列卷積神經網絡的參數設定一個初始值后,根據實際的標準密度圖算出輸入圖片的損失:L(Θ),然后在每一次優化迭代中更新整個網絡的參數Θ,直到損失值收斂到一個較小的值。
優選地,采用隨機梯度下降法在每一次優化迭代中更新整個網絡的參數Θ。
優選地,輸入圖像x對應的實際人群密度圖M(x)表示為:)式中,N為圖像中的人數,表示輸入圖像x中每個像素的位置,xi為第i個人頭在輸入圖像x中的位置,δ(·)為單位沖擊函數,*為卷積操作,為標準差為σi的高斯核。
本發明在三個公共數據集上以及一個發明人自己提出的數據集上與其他方法進行了比較,公共數據集包括UCF_CC_50,UCSD和WorldExpo。各個數據集的信息如下表所示:
上表中,Num為圖像數量,Max、Min分別表示圖像中出現的最大人數和最小人數,Ave表示圖像的平均人數,Total是數據集中所有的人數。
發明采用平均絕對誤差(MAE):和均方誤差(MSE):(N為圖片數量,zi為第i幅圖像中實際的人頭數,為第i幅圖像通過本發明提供的網絡輸出的人頭數)來衡量算法的準確性。在UCF_CC_50數據集上,本發明方法與現有技術的對比,如下表所示(MCNN為本發明的算法):
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海科技大學,未經上海科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201511030645.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于字符位置的車牌定位方法
- 下一篇:指紋辨識裝置及其制造方法





