[發明專利]基于卷積神經網絡的非剛性多尺度物體檢測方法在審
| 申請號: | 201710989778.3 | 申請日: | 2017-10-20 |
| 公開(公告)號: | CN107818302A | 公開(公告)日: | 2018-03-20 |
| 發明(設計)人: | 饒江浩;徐智勇;張建林 | 申請(專利權)人: | 中國科學院光電技術研究所 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610209 *** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 神經網絡 剛性 尺度 物體 檢測 方法 | ||
技術領域
本發明涉及物體實時檢測的技術領域,具體涉及一種基于卷積神經網絡的非剛性多尺度物體的檢測方法。
背景技術
如圖3所示,神經元是模仿生物神經構造的數學模型,不同的輸入(如不同的像素點)通過加權(如卷積神經網絡中的卷積運算)求和,在節點處同過非線性函數(激活函數)的變換得到該神經節點的輸出。如圖4所示,眾多神經節點可形成神經層,眾多神經層可搭建神經網絡。神經網絡由于輸入通過多層非線性變換(非線性函數的嵌套),表現出對訓練數據強大的擬合能力(學習能力),從而表現出良好的預測能力。
對于神經網絡模型,有訓練和測試兩個階段。訓練是通過輸入訓練圖片,得到的輸出與標準輸出(標注)對比,其誤差是通過損失函數體現,通過優化參數來減小損失函數。測試則是對訓練好的模型性能的評估,通過測試結果可以評估出模型的泛化能力。
在檢測任務中,網絡模型和三個主要板塊:區域提名(選取目標可能區域,往往通過滑窗和選擇性搜索),但常規方法中滑窗其實是一種窮舉法,過程存在很多冗余,選擇性搜索則需要耗費大量時間。在端到端的檢測(定位、識別一體化)中采取了網格劃分,每個區域各自判定是否為目標,然后綜合得出最后結果。
發明內容
本發明要解決技術問題為:在移動設備和小體積設備的目標實時檢測中,由于不同場景中非剛性多尺度目標形態、角度多變,傳統檢測方法普適性和魯棒性不高。在采用神經網絡和劃分網格區域搜索的方案中,一定程度上解決了普適性和魯棒性的問題,同時又保證了檢測的實時性。
本發明解決上述技術問題采用的技術方案為:一種基于卷積神經網絡的非剛性多尺度物體(如紅外行人圖像)檢測方法,構造具有強大特征提取和學習能力的神經網絡檢測系統,使得在數據集中學習到非剛性物體不同尺度上的抽象特征;再將程序移植到開發平臺,通過硬件設備輸入圖像并進行目標的實時檢測。
進一步地,具有合適且準確標定的數據集(監督學習),由于神經網絡訓練數據集中缺乏針對較小紅外目標的訓練數據集,且現階段神經網絡在檢測較小目標方面存在瓶頸,通過在網絡上尋找、篩選非標配的數據集,編寫腳本把數據集標注轉換為網絡可用的數據,在此基礎上,通過拍攝和標注,擴充了數據,形成了可訓練的數據集。
進一步地,具有強大特征提取能力和學習能力的模型,由于非剛性目標(如:人)在不同角度姿態上差異比較大,且目標存在不同尺度,非單一場景下傳統方法性能受到限制,該方法采用了具有強大特征提取能力的分類模型——深度網絡,該模型將不同的網絡層之間密集連接,使得各層特征利用充分。
進一步地,在硬件平臺上能夠實現實時檢測。通過提取出非剛性目標的特征,再由神經網絡中的回歸層和分類層對侯選框進行目標識別和位置估計,這一端到端的過程同時完成目標的識別和定位,通過區域網格劃分并對每個區域實施上述操作,簡化了搜過可能目標的過程,一次性完成了目標與非目標的判定,從而保證了檢測的實時性,最后的非極大值抑制去處了冗余的檢測輸出。
本發明與現有技術相比的優點在于:
(1)本發明特點是端到端的網絡結構保證了檢測的實時性。與一般模型相比,采用了較多的均值池化縮減運算數據,運用稠密連接的思想,在不增加網絡深度的情況下來提高網絡網絡的性能,同時該神經網絡的框架簡潔,具有高的可移植性,使得訓練好的網絡能直接運用到成像系統目標檢測上,實現檢測技術的落地,實現了小體積設備具有智能性的檢測。
(2)本發明在訓練數據上采用了增廣的方法,同時把數據庫中的正樣本(目標充滿整張圖片)當做目標檢測的訓練數據,進一步針對性地學習目標本身的特征。
附圖說明
圖1為本發明方法網絡訓練過程實現的流程圖;
圖2為本發明方法網絡檢測過程實現的流程圖;
圖3為神經網絡中神經元節點的數學模型;
圖4神經網絡的基本模型;
圖5為稠密連接模型;
圖6為網格劃分輸入圖像示意圖;
圖7示意經過特征提取后網絡分類識別出目標所在的網格區域;
圖8表示對目標所在的區域運用侯選框進行回歸;
圖9為經過非極大值抑制冗余檢測框后的最終輸出;
圖10為訓練過程中損失函數變化圖表。
具體實施方式
下面結合附圖以及具體實施方式進一步說明本發明。
如圖1所示,本發明一種基于卷積神經網絡的非剛性多尺度物體檢測方法,該方法具體步驟如下:
步驟1、帶標注的圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院光電技術研究所,未經中國科學院光電技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710989778.3/2.html,轉載請聲明來源鉆瓜專利網。





