[發明專利]基于金字塔注意力網絡的人群計數方法及系統在審
| 申請號: | 202010320955.0 | 申請日: | 2020-04-22 |
| 公開(公告)號: | CN111523449A | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 呂蕾;顧玲玉;謝錦陽;陳梓銘;張金玲 | 申請(專利權)人: | 山東師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 金字塔 注意力 網絡 人群 計數 方法 系統 | ||
本發明公開了基于金字塔注意力網絡的人群計數方法及系統,包括:獲取待計數圖像;將獲取的待計數圖像,輸入到訓練好的基于金字塔注意力網絡中,訓練好的基于金字塔注意力網絡對待計數圖像進行特征提取,提取出第一特征和第二特征,然后將提取的第一特征和第二特征進行特征融合,得到全局特征圖;將全局特征圖進行密度圖回歸,得到人群密度圖;對人群密度圖進行積分,得到最終的人群計數數值。
技術領域
本公開涉及計算機視覺技術領域,特別是涉及基于金字塔注意力網絡的人群計數方法及系統。
背景技術
本部分的陳述僅僅是提到了與本公開相關的背景技術,并不必然構成現有技術。
隨著踩踏事件的頻繁發生,為了人群控制和公眾安全,準確地估計來自圖像的人群的人數已經成為計算機視覺技術越來越重要的應用。計算機視覺技術中的人群計數任務是自動計算圖像中的人數。為了在諸如公眾集會和體育賽事等許多場景中幫助控制人群和公共安全,準確的人群計數顯得越來越重要。
在大多數需要進行人群計數和密度估計的場景下,人群的密集度均較高,也就造成了嚴重的遮擋、目標尺度不一致的問題。早期的方法一般使用基于檢測和回歸的方法統計場景中人的總數。
由于密集人群遮擋嚴重、目標尺寸相差較大,基于檢測的方法效果較差;而直接回歸場景中人的數目從獲取一個目標函數的角度來講使問題的輸入域和輸出域相差很大,也就導致了目標函數更難以擬合,也無法達到較好的效果。
針對以上兩種傳統方法的不足,基于深度學習卷積神經網絡的方法被用于密集人群圖像的估計中。目前主流的估計方法采用了密度圖的思想,即設計一個神經網絡,網絡的輸入為原始圖像,而輸出為人群的密度圖。
在實現本公開的過程中,發明人發現現有技術中存在以下技術問題:
近年來,基于多尺度提取特征的方法成為了人群計數的主流,此類方法既可以簡化任務的目標函數,也可以在統計人群總數的基礎上得到信息更加充足的人群密度分布,為后續的其他應用提供更大的幫助。
目前效果較好的方法為基于多路卷積的方法,使用多路具有不同大小卷積核的卷積神經網絡提取原始圖像中的多尺度信息,之后將得到的多組特征圖進行融合,得到最終的密度圖,在一定程度上解決了人群計數中最為棘手的多尺度問題。
但此類方法由于使用多路不同的卷積神經網絡,多路分支的參數及其提取的特征均存在大量冗余,同時由于參數量巨大,計算復雜度高、計算速度慢,為了控制參數導致網絡較淺,每一路分支網絡都無法充分地提取相應的信息,在一定程度上限制了其效果。
發明人發現,現有技術中的針對圖像處理的人群計數方法,存在效率低和準確率低的技術缺陷。
發明內容
為了解決現有技術的不足,本公開提供了基于金字塔注意力網絡的人群計數方法及系統;
第一方面,本公開提供了基于金字塔注意力網絡的人群計數方法;
基于金字塔注意力網絡的人群計數方法,包括:
獲取待計數圖像;
將獲取的待計數圖像,輸入到訓練好的基于金字塔注意力網絡中,訓練好的基于金字塔注意力網絡對待計數圖像進行特征提取,提取出第一特征和第二特征,然后將提取的第一特征和第二特征進行特征融合,得到全局特征圖;將全局特征圖進行密度圖回歸,得到人群密度圖;
對人群密度圖進行積分,得到最終的人群計數數值。
第二方面,本公開提供了基于金字塔注意力網絡的人群計數系統;
基于金字塔注意力網絡的人群計數系統,包括:
獲取模塊,其被配置為:獲取待計數圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東師范大學,未經山東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010320955.0/2.html,轉載請聲明來源鉆瓜專利網。





