[發(fā)明專利]基于多尺度感知注意力網(wǎng)絡的人群計數(shù)方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011519235.3 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112541459A | 公開(公告)日: | 2021-03-23 |
| 發(fā)明(設計)人: | 呂蕾;謝錦陽;顧玲玉;李中會 | 申請(專利權)人: | 山東師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06K9/40;G06N3/04;G06N3/08 |
| 代理公司: | 濟南圣達知識產(chǎn)權代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 尺度 感知 注意力 網(wǎng)絡 人群 計數(shù) 方法 系統(tǒng) | ||
1.基于多尺度感知注意力網(wǎng)絡的人群計數(shù)方法,其特征是,包括:
獲取待處理的目標圖像;
對待處理的目標圖像進行初級特征提取,得到目標圖像的初級特征;
對初級特征分別進行不同尺度的全局上下文信息提取,得到不同尺度的全局上下文信息;同時,對初級特征進行全局平均池化操作,得到平均池化的全局上下文信息;
對每個尺度的全局上下文信息,學習出每個尺度的注意力特征;基于每個尺度的注意力特征和該尺度的全局上下文信息,得到每個尺度的去噪后的上下文信息;將所有尺度的去噪后的上下文信息進行融合得到第一融合結果;將第一融合結果,再與平均池化的全局上下文信息進行融合,得到第二融合結果;
對第二融合結果進行解碼處理得到最終的密度圖,對密度圖進行積分處理,得到圖像上的人群總數(shù)。
2.如權利要求1所述的基于多尺度感知注意力網(wǎng)絡的人群計數(shù)方法,其特征是,對待處理的目標圖像進行初級特征提取,得到目標圖像的初級特征;具體步驟包括:
使用改進的VGG16網(wǎng)絡,對待處理的目標圖像進行初級特征提取,得到目標圖像的初級特征;
所述改進的VGG16網(wǎng)絡,為對VGG16網(wǎng)絡只保留前10個卷積層,刪除后六個卷積層、全連接層和softmax分類器。
3.如權利要求1所述的基于多尺度感知注意力網(wǎng)絡的人群計數(shù)方法,其特征是,對初級特征分別進行不同尺度的全局上下文信息提取,得到不同尺度的全局上下文信息;具體步驟包括:
對初級特征,采用1*1的卷積層進行全局上下文特征提取,得到第一尺度的全局上下文特征;
對初級特征,采用空洞率為6的3*3空洞卷積層進行全局上下文特征提取,得到第二尺度的全局上下文特征;
對初級特征,采用空洞率為12的3*3空洞卷積層進行全局上下文特征提取,得到第三尺度的全局上下文特征;
對初級特征,采用空洞率為18的3*3空洞卷積層進行全局上下文特征提取,得到第四尺度的全局上下文特征。
4.如權利要求1所述的基于多尺度感知注意力網(wǎng)絡的人群計數(shù)方法,其特征是,對初級特征進行全局平均池化操作,得到平均池化的全局上下文信息;具體步驟包括:
采用全局平均池化層,對初級特征進行全局平均池化操作,得到平均池化的全局上下文信息。
5.如權利要求1所述的基于多尺度感知注意力網(wǎng)絡的人群計數(shù)方法,其特征是,對每個尺度的全局上下文信息,學習出每個尺度的注意力特征;具體步驟包括:
對第一尺度的全局上下文特征,采用維度注意力機制的并列三個分支分別進行特征提取,將三個分支提取的特征進行聚合操作,得到第一尺度的注意力特征;
對第二尺度的全局上下文特征,采用維度注意力機制的并列三個分支分別進行特征提取,將三個分支提取的特征進行聚合操作,得到第二尺度的注意力特征;
對第三尺度的全局上下文特征,采用維度注意力機制的并列三個分支分別進行特征提取,將三個分支提取的特征進行聚合操作,得到第三尺度的注意力特征;
對第四尺度的全局上下文特征,采用維度注意力機制的并列三個分支分別進行特征提取,將三個分支提取的特征進行聚合操作,得到第四尺度的注意力特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東師范大學,未經(jīng)山東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011519235.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





