[發明專利]基于多階段混合注意網絡的人群計數方法在審
| 申請號: | 202110007377.X | 申請日: | 2021-01-05 |
| 公開(公告)號: | CN112668532A | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 桑軍;王富森;劉新悅;田紹禮;喬鑫;蔡斌;夏曉峰 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 楊柳岸 |
| 地址: | 400044 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 階段 混合 注意 網絡 人群 計數 方法 | ||
本發明涉及一種基于多階段混合注意網絡的人群計數方法,屬于視覺處理領域。該方法包括:S1、對輸入圖像進行高斯模糊生成標簽密度圖并進行數據增強;S2、建模多階段混合注意網絡并初始化權重參數;S3、數據增強后的訓練集人群圖像輸入到S2的網絡中進行訓練,并將輸出密度圖與標簽密度圖作歐幾里德損失計算誤差,通過誤差反向傳播更新網絡參數直到訓練結束并保存最優模型;S4、將測試集人群圖像輸入到最優模型中輸出密度圖并進行積分得到估計人數。
技術領域
本發明屬于視覺處理領域,涉及基于多階段混合注意網絡的人群計數方法。
背景技術
出現大型的聚集活動,例如學術會議、商場促銷展、體育賽事、交通繁忙地區以及熱門旅游景點,需要針對這些聚集地點統計人群數量,對人群密度進行估計。這樣既可以統計活動到場人數,減少工作人員工作量;又可以針對人群數目,提前做好安全措施,防止出現擁擠踩踏事故。
傳統的人群計數方法大多集中在基于檢測的方法上,使用滑動窗口式的檢測器來檢測行人并計數。最經典的基于目標檢測的人群計數模型是MSCNN,該模型的主要方法為:
(1)使用一組固定的濾波器在不同尺度特征圖上提取特征;
(2)放大所提取的特征用于檢測。隨著活動場景人群數量的暴增、攝像頭視野變大、復雜的背景噪聲等問題,導致人群之間遮擋越來越嚴重,因此基于檢測的方法不再適用于人群密集區域。
隨著深度學習在計算機視覺領域的廣泛應用,Zhang等人于2016年提出一種用于人群計數的多列卷積網絡模型,并提出生成人群密度圖作為監督數據訓練網絡的新方法,即采用自適應高斯核根據圖像中每個人頭的大小估計高斯核的大小。然而,復雜的背景噪聲使得網絡不能正確區分人頭和噪聲區域,這使得網絡收斂很差,人群計數不準確。
為了解決樹葉、建筑物等背景噪聲問題,Gao等人提出了一種空間/通道級注意回歸網絡,其中空間注意模塊和通道注意模塊均采用類似No-local的手段建模全局尺度的上下文依賴,但這樣顯著增加了大量的計算量卻沒有帶來明顯的效果提升。因為,在考慮幾乎等價的計算量的前提下,選擇串聯多個混合注意網絡,可以更好地過濾背景噪聲區域,帶來顯著的效果提升。
發明內容
有鑒于此,本發明的目的在于提供一種基于多階段混合注意網絡的人群計數方法。
為達到上述目的,本發明提供如下技術方案:
基于多階段混合注意網絡的人群計數方法,該方法包括以下步驟:
S1:利用人群數據集的標注信息生成標簽密度圖,并對其中的訓練集進行數據增強;
S2:建模多階段混合注意網絡;
S3:初始化預訓練模型及其它網絡層參數;
S4:輸入訓練圖像,輸出預測密度圖,并計算預測密度圖和標簽密度圖的損失;
S5:選擇優化算法最小化損失,進行誤差反向傳播更新網絡參數;
S6:每訓練一次,就在測試集上通過評價指標驗證模型計數性能;
S7:迭代訓練至一定次數,并保存結果最優模型;
S8:將測試集圖片輸入S7保存的最優性能模型,輸出預測密度圖并進行積分獲得估計人數。
可選的,所述S1具體為:利用高斯核函數對人群數據集的位置級注釋進行高斯模糊,生成標簽密度圖作為監督數據,并對訓練集進行數據增強,以此來增加訓練樣本,提升模型的泛化能力;
S11:采用大小為4的固定高斯核生成標簽密度圖,由于網絡輸出分辨率為原圖的1/8,使用雙線性插值對標簽密度圖進行8倍下采樣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110007377.X/2.html,轉載請聲明來源鉆瓜專利網。





