[發明專利]面向無人機航拍圖像的分割引導注意力群體計數方法在審
| 申請號: | 202210740932.4 | 申請日: | 2022-06-28 |
| 公開(公告)號: | CN115019211A | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 范哲意;宋梓豪;吳迪;朱藝璇 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06V20/17 | 分類號: | G06V20/17;G06V10/82;G06V10/26;G06N3/08;G06N3/04 |
| 代理公司: | 北京康度知識產權代理事務所(特殊普通合伙) 11705 | 代理人: | 王彬 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 無人機 航拍 圖像 分割 引導 注意力 群體 計數 方法 | ||
本公開提供一種面向無人機航拍圖像的分割引導注意力群體計數方法,所述方法包括:獲取包括訓練集和測試集在內的圖像集;對訓練集中的圖像進行預處理;將經過預處理的圖像輸入網絡,訓練網絡,直至網絡擬合,訓練后的網絡輸出圖像的密度圖和分割圖,所述網絡包括卷積塊,Inception級聯模塊、上采樣器、淺層分割引導注意力模塊、深層分割引導注意力模塊以及第一和第二加法器;以及根據網絡輸出的密度圖,將密度圖的像素值求和得到圖像中的群體計數。
技術領域
本發明涉及一種圖像處理技術,更具體地,涉及一種面向無人機航拍圖像的分割引導注意力群體計數方法。
背景技術
隨著城鎮化進程的推進以及智慧城市的建設,城市中人口快速增長,大規模的群體活動也越來越多。當人群密度過高時,容易引起人群擁擠,甚至發生踩踏事件,引發嚴重的安全事故。近年來,隨著無人機市場的不斷擴大和日漸普及,利用無人機從空中完成對人群行為的分析與預測逐漸成為安防的重要手段之一。該技術利用從視頻幀圖像中提取的特征來預估當前場景人數。
傳統的人群密度估計算法可以被分為三類:檢測法,回歸法和基于密度估計的方法。基于檢測的方法通常采用滑動窗口來遍歷整幅圖像,逐步使用滑動窗口檢測窗口中的人群,將所有窗口的檢測結果相加得到計數結果。但當人群有較嚴重的遮擋或背景復雜時,基于檢測的人群計數算法無法得到準確的結果。基于回歸的方法不逐個檢測和定位每個個體,而是通過映射人工設計的特征和最終計數結果的關系來完成計數。由于基于回歸的方法只給出了最終計數結果,并不能準確反映人群在場景中的分布,空間信息的忽視導致了其不足以支撐實際應用。基于密度估計的方法則通過學習特征與密度圖之間的映射關系實現計數,但由于提取的特征不充分以及映射關系復雜多樣,使得最終效果欠佳。
隨著深度學習的飛速發展,卷積神經網絡憑借其對圖像特征的出色學習能力,已被廣泛應用于圖像分類,目標檢測等計算機視覺領域,也在群體計數表現出獨特優勢。
雖然深度學習給人群計數帶來很大發展,但仍然存在一些尚未解決的問題,例如復雜背景對人群的遮擋干擾。由于近大遠小的視覺特性,無人機在空中拍攝圖片時,同一場景下相鄰的人會發生互相遮擋,甚至會被其他建筑或物品遮擋,造成最終計數結果不準確,影響最終效果。人群附近的背景像素噪聲也會干擾模型提取特征,導致發生誤判,影響計數準確性。
因此,需要一種高效且準確的群體計數方法。
發明內容
本發明是為了解決上述問題而提出的,其目的在于提供一種面向無人機航拍圖像的分割引導注意力群體計數方法。
為了達到上述發明目的,根據本發明的一方面,提供一種面向無人機航拍圖像的分割引導注意力群體計數方法,所述方法包括:獲取包括訓練集和測試集在內的圖像集;對訓練集中的圖像進行預處理;將預處理后的圖像輸入網絡,訓練網絡,直至網絡擬合,訓練后的網絡輸出圖像的密度圖和分割圖,所述網絡包括卷積塊,Inception級聯模塊、上采樣器、淺層分割引導注意力模塊、深層分割引導注意力模塊以及第一和第二加法器;以及根據網絡輸出的密度圖,將密度圖的像素值求和得到圖像中的群體計數。
訓練網絡的步驟包括:
卷積塊將預處理后的圖像處理為特征F1,F1的通道數為768;
將特征F1分別輸入Inception級聯模塊和淺層分割引導注意力模塊,分別得到特征F2,S1和D1,特征F2的通道數為2048,S1的通道數為1,特征D1的通道數為1;
通過上采樣器對得到的特征F2進行上采樣,上采樣后的特征的尺寸變為特征F2的兩倍,然后將上采樣后的特征F2輸入深層分割引導注意力模塊,分別得到特征S2和D2,特征S2和特征D2的通道數分別為1和1;
通過第一加法器將得到的特征S1和S2加權求和,最終得到與輸入圖像尺寸相同的預測分割圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210740932.4/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





