[發明專利]基于卷積神經網絡的快速目標檢測方法有效
| 申請號: | 201510061852.6 | 申請日: | 2015-02-06 |
| 公開(公告)號: | CN104573731B | 公開(公告)日: | 2018-03-23 |
| 發明(設計)人: | 王菡子;郭冠軍;嚴嚴 | 申請(專利權)人: | 廈門大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 廈門南強之路專利事務所(普通合伙)35200 | 代理人: | 馬應森 |
| 地址: | 361005 *** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 神經網絡 快速 目標 檢測 方法 | ||
1.基于卷積神經網絡的快速目標檢測方法,其特征在于包括以下步驟:
A)準備訓練樣本集(xi,yi),i=1,……,N,N為訓練樣本數,N為自然數,xi表示訓練樣本對應的固定大小的圖像,包含目標且目標充滿畫幅的圖像是正樣本,其他圖像是負樣本;yi表示樣本類別向量:
B)將所有訓練樣本分m批,將m-2批樣本放進設計的卷積神經網絡里用反向傳播算法訓練,2批樣本用于測試,所述卷積神經網絡包含卷積層、最大池化層和局部對比歸一化層三個成分,這三個成分扮演非線性函數的功能,目的是把位于流形上的原始圖像映射到歐式空間,卷積的激活函數采用非線性校正單元,設計好包含這三個成分的網絡結構模型后,用反向傳播算法訓練對模型進行訓練,得到參數W;
C)提取步驟B)中的訓練好的參數W,采用擴展圖的方式解決卷積神經網絡中最大池化丟失信息的問題,給定測試圖像,針對2×2的卷積核中每個偏移,都保存一個對應的特征圖,稱為擴展圖;對于每一層max-pooling核大小為K,整個卷積神經網絡有p層,擴展之后每個最大池化的下采樣層特征圖數目擴展至2K倍,整個網絡擴展到o=(2K)p倍,然后把參數W用于任意大小的待檢測圖像,獲取全連接前的擴展特征圖,稱它為判別完備特征;給定輸入圖像x,已訓練好的濾波器組K和偏移b,卷積層的輸出寫成公式一的形式:
其中Mj表示所選擇輸入特征圖的索引;l表示當前層的索引;i和j分別表示輸入和輸出特征圖索引;o表示段索引;f表示激活函數,這里使用線性校正單元函數f(x)=max(x,0);*表示卷積操作;
最大池化層寫成公式二的形式:
其中,m和n分別表示當前層的像素索引;s表示下采樣核的大小;p和q分別表示前一層的像素索引,并且滿足p=s*(m-1)+k+1,q=s*(n-1)+k+1,其中0<k<s;分號用于選擇對應的列和行;
為了使得獲得的特征具有魯邦的性質,把局部對比歸一化層引入分段處理的環節中,該層寫成公式三的形式:
其中,r表示制定的鄰近競爭特征圖的數目,N表示當前層總共的特征圖數目,k,α,β是一些超參數,在訓練過程中指定合適的浮點數值,當CNN模型訓練好后,根據以上三個公式,獲取判別完備特征為后續的基于平滑窗掃描提供支撐;
D)把卷積神經網絡的全連接看成一個線性分類器,直接基于判別完備特征圖做檢測,采用可能近似學習框架來估計線性分類器在判別完備特征上的泛化誤差R[ω],然后根據組合模型和所期望泛化誤差H[ω]計算所需要訓練模型數目q;
E)將q個模型中得每一個訓練模型分別在待檢測圖像上執行前饋操作,每一個模型獲取o組全連接前的判別完備特征圖,然后用最近鄰插值算法對每組判別完備特征圖縮放,得到n*o組判別完備特征圖,q個模型共計n*o*q組判別完備特征圖,然后在每組判別完備特征圖上直接用線性分類器執行密集平滑窗分類工作得到n*o*q組響應圖,其中線性分類器和判別完備圖的點積操作轉成卷積操作;
F)對n*o*q中的每o組響應圖采用非極大值得到n*q組響應圖,然后對n*q響應圖中的每n個響應圖執行非極大值抑制得到q組具有真實尺度的響應圖,把q組響應圖執行與運算得到一個具有真實尺度的最終響應圖,計算最終響應圖中的每一個聯通區域的質心:
G)把質心和真實尺度映射到原待檢測圖中,根據每一個質心位置和尺度值畫出對應的矩形框,完成目標檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510061852.6/1.html,轉載請聲明來源鉆瓜專利網。





