[發明專利]一種人群計數的注意力縮放機制在審
| 申請號: | 202110658494.2 | 申請日: | 2021-06-15 |
| 公開(公告)號: | CN113284130A | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 莫敏玲 | 申請(專利權)人: | 廣東藍鯤海洋科技有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/11;G06T7/136;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 519000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 人群 計數 注意力 縮放 機制 | ||
1.一種人群計數的注意力縮放機制,其特征在于,包括以下步驟:
步驟S1:分別建立密度注意力網絡和注意力縮放網絡;
步驟S2:通過所述密度注意力網絡為注意力縮放網絡提供有關不同密度級別區域的注意力掩碼;
步驟S3:注意力縮放網絡分別生成中間密度圖和縮放因子;
步驟S4:注意力縮放網絡將所生成的中間密度圖及縮放因子乘以注意力掩碼,以乘以輸出密度圖,將其相加得出最終的密度圖;
步驟S5:計算每個子區域的局部損耗,并聚合所有的局部損失以得到最終的損失函數。
2.根據權利要求1所述的一種人群計數的注意力縮放機制,其特征在于,所述注意力縮放網絡有兩個分支,且兩個分支分別是密度估計和注意力縮放,且所述密度估計用于生成中間密碼圖,且所述注意力縮放用于生成縮放因子。
3.根據權利要求2所述的一種人群計數的注意力縮放機制,其特征在于,所述密度注意網絡具體包括以下步驟:
步驟X1:首先,通過使用64×64滑動窗口,逐像素掃描訓練集中的真實密度圖來獲得所有局部計數;
步驟X2:其次,計算出所有非零本地計數的平均值AvgCnt11,并找到最小計數MinCnt和最大計數MaxCnt;
步驟X3:接著,使用{MinCnt,AvgCnt11,MaxCnt}作為閾值集,將密度分為低密度和高密度兩個級別;
步驟X4:使用獲得的閾值集來根據其對應的局部計數自動標記地面真實密度圖中的每個像素。
4.根據權利要求3所述的一種人群計數的注意力縮放機制,其特征在于,所述步驟X3還包括:
步驟X31:迭代地計算所有低密度計數的平均值AvgCnt21和所有高密度計數的平均值AvgCnt22;
步驟X32:使用新的閾值集{MinCnt,AvgCnt21,AvgCnt11,AvgCnt22,MaxCnt}將密度分為四個級別,依此類推。
5.根據權利要求4所述的一種人群計數的注意力縮放機制,其特征在于,所述步驟X4具體包括:
步驟X41:給定N個密度級別,將有N+1個密度標簽,其中包括一個額外的背景標簽;
步驟X42:當獲得了真實的密度水平標簽,訓練提出的密度注意力網絡,以學習將輸入人群圖像的每個像素分類為不同的密度級別;
步驟X43:密度注意力網絡將人群圖像分割為不同密度級別的區域,每個區域對應一個二進制注意力掩碼;
步驟X44:在獲得N個前景注意力掩碼之后,使用一個膨脹操作來擴展每個掩碼;
步驟X45:相鄰的注意掩模之間存在重疊,當對基于注意掩模的密度圖求和時,將與重疊的掩模區域相對應的密度值平均,將經過訓練的VGG-16模型的前13個卷積層用作主干網絡;
步驟X46:在主干之上添加四個新的卷積層,采用二維的softmax交叉熵損失訓練密度注意力網絡。
6.根據權利要求5所述的一種人群計數的注意力縮放機制,其特征在于,所述步驟X46還包括:第一個具有大小為1×1的卷積核,并具有256個輸出通道,第二層是反卷積層,具有2×2卷積核,步幅為2個像素,第三個具有3×3卷積核和128個輸出通道,第四個具有1×1卷積核和N+1個輸出映射。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東藍鯤海洋科技有限公司,未經廣東藍鯤海洋科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110658494.2/1.html,轉載請聲明來源鉆瓜專利網。





