1.一種基于多視域圖卷積網絡的行人檢測方法,其特征在于,包括以下步驟:
步驟1)、采用卷積神經網絡從待處理圖像進行特征提取,對提取的特征圖像進行多次池化、卷積處理得到預處理特征圖像;
步驟2)、采用多視域池化金字塔提取步驟1)中得到的預處理特征圖像的多尺度特征信息特征圖;
步驟3)、在步驟1)中提取的特征圖像進行倒數第二次池化、卷積處理得到特征圖像和步驟2)中得到的多尺度特征信息圖上分別建立人體部位圖模型,然后進行人體圖卷積得到多個人體圖卷積后的特征圖;
步驟4)、采用Nbox個錨點的預測框分別對人體圖卷積后的特征圖中的人體目標區域進行預測并識別,完成預測框及預測類別概率值,即完成行人目標的檢測。
2.根據權利要求1所述的一種基于多視域圖卷積網絡的行人檢測方法,其特征在于,構建多分辨率和多視域特征金字塔模型,包含四個用于對采集的特征圖的空間大小進行下采樣的最大池化層,利用四個最大池化層依次進行池化后得到具有不同空間分辨率的五個特征圖。
3.根據權利要求2所述的一種基于多視域圖卷積網絡的行人檢測方法,其特征在于,具體包括以下步驟:
步驟1.1,采用卷積神經網絡將待處理圖像縮放至分辨率為300×300得到縮放后的圖像A;
步驟1.2,采用2組卷積層對圖像A進行卷積得到300×300大小的特征圖像B,每組卷積采用64個卷積核;
步驟1.3,對特征圖像B進行池化,得到分辨率為150×150的特征圖像BP,并采用2組卷積層對特征圖像BP進行卷積,每組卷積采用128個卷積核,得到150×150大小的特征圖像C;
步驟1.4,對特征圖像C進行池化,得到分辨率為75×75的特征圖像CP,并采用3組卷積層對特征圖像CP進行卷積,每組卷積采用256個卷積核,得到75×75大小的特征圖像D;
步驟1.5,對特征圖像D進行池化,得到分辨率為38×38的特征圖像DP,并采用3組卷積層對特征圖像DP進行卷積,每組卷積采用512個卷積核,得到38×38大小的特征圖像E;
步驟1.6,對特征圖像E進行池化,得到分辨率為19×19的特征圖像EP,并采用3組卷積層對特征圖像EP進行卷積,每組卷積采用512個卷積核,得到19×19大小的預處理特征圖像F。
4.根據權利要求3所述的一種基于多視域圖卷積網絡的行人檢測方法,其特征在于,步驟2)具體包括以下步驟:
步驟2.1,對19×19大小的預處理特征圖像F,分別使用分辨率為1×1、3×3和5×5的卷積核進行卷積成分辨率為19×19大小的特征圖F1、特征圖F2和特征圖F3;
步驟2.2,分別對特征圖F1,特征圖F2和特征圖F3采用不同間隔的空洞卷積進行多視域特征的提取分別得到19×19大小的特征圖Fmrc1,特征圖Fmrc2和特征圖Fmrc3;
步驟2.3,對19×19大小的特征圖Fmrc1,特征圖Fmrc2和特征圖Fmrc3分別進行4次最大池化操作分別得到特征圖Fmrc1,特征圖Fmrc2和特征圖Fmrc3的5組不同尺度的池化特征圖;
步驟2.4,對步驟2.3得到的15組池化特征圖中相同尺寸的池化特征進行連接得到多尺度特征信息。
5.根據權利要求4所述的一種基于多視域圖卷積網絡的行人檢測方法,其特征在于,其中分辨率為5×5的卷積核采用1個分辨率為1×1和2個分辨率為3×3的卷積核。