[發明專利]一種用于行人檢測的協同式深度網絡模型方法有效
| 申請號: | 201611166903.2 | 申請日: | 2016-12-16 | 
| 公開(公告)號: | CN106650806B | 公開(公告)日: | 2019-07-26 | 
| 發明(設計)人: | 王文敏;松鴻蒙;王榮剛;李革;董勝富;王振宇;李英;趙輝;高文 | 申請(專利權)人: | 北京大學深圳研究生院 | 
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00;G06N3/04 | 
| 代理公司: | 北京萬象新悅知識產權代理有限公司 11360 | 代理人: | 黃鳳茹 | 
| 地址: | 518055 廣東省深*** | 國省代碼: | 廣東;44 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 行人 檢測 協同 深度 網絡 模型 方法 | ||
本發明公布了一種用于行人檢測的協同式深度網絡模型方法,包括:構建一種新的協同式多模型學習框架來完成行人檢測中的分類過程;利用人工神經元網絡來整合協同式模型中各子分類器的判決結果,并借用機器學習的方法訓練該網絡,能夠更加有效地綜合各分類器反饋的信息;提出一種基于K?means聚類算法的重采樣方法,增強協同模型中各分類器的分類效果,進而提升整體分類效果。本發明通過建立協同式深度網絡模型,將由聚類算法得到的不同類型的訓練數據集用于并行地訓練多個深度網絡模型,再通過人工神經元網絡將原始數據集在各個深度網絡模型上的分類結果進行整合和綜合分析,以實現更加精準的樣本分類。
技術領域
本發明屬于信息技術領域,涉及數字文件內容保護技術,尤其涉及一種用于行人檢測的協同式深度網絡模型方法。
背景技術
無論是自然科學研究還是社會科學研究,人類自身一直是其中最重要的關注對象,因此,利用計算機分析人類活動一直是計算機視覺領域中最熱門的研究課題。而人類動作識別和事件檢測等智能化行為的分析都需要以快速準確的行人檢測為前提,因而行人檢測技術的研究日益受到學術界和工業界的廣泛關注,對現代視頻監控、智能機器人和無人駕駛技術的發展均具有深遠意義。一般來說,行人檢測是指判斷給定圖像或視頻幀中是否包含行人,如果包含,并標出行人位置的過程,因而可以分為樣本的分類和定位兩大部分。其中,快速準確的樣本分類是行人檢測技術的前提和關鍵。
現有的行人檢測技術已較為成熟,其基本框架來源于HOG+SVM模型。其中,行人樣本的分類大致分為樣本收集(候選框提取)、預處理、特征提取、分類器訓練和測試五個主要步驟。其中,特征提取和分類器訓練是影響檢測性能的關鍵。按照分類過程所使用分類器數目的多少,行人檢測算法可以分為單分類器模型算法和多分類器模型算法。在第一類中,基于人工特征的檢測算法和基于深度學習的檢測算法占據主流。前者先用人工定義的方法從圖像中提取特征,包括HOG特征、LBP特征、ACF等,再送入常用分類器中進行訓練,最后利用訓練好的模型去區分行人和非行人樣本。后來,深度學習算法的出現大大提高了特征提取的準確性和分類器的檢測性能,但仍然受限于單個分類器在特征學習能力上的局限性,其結果仍未達到理想水平。第二類算法成功突破了單分類器模型的瓶頸,它們使用多個分類器去學習樣本特征,并將各分類結果整合在一起,實現了更加精準的分類效果,如常用的基于部件模型的分類算法、級聯模型和集成模型等。基于部件的模型往往從樣本的各個部分出發,提取局部特征,訓練局部分類器,最后再整合分析,對于遮擋較為嚴重的樣本能夠較好地學習到有用的輪廓特征,從而大大提升了檢測性能;級聯模型則使用Boosting的思想,將多個分類器順序排列,然后用不同的樣本逐一訓練這些分類器,使得它們具備不同的分類能力,其中后一分類器的設計需依據前一分類器的分類結果,最終級聯所有的弱分類器形成一個強分類器,從分類器互補的角度改進了檢測算法的性能;集成模型則是多分類器模型中較為罕見的一類,在行人檢測領域尚未被人關注和使用,它采用并行的方式來整合多個分類器,讓所有子分類器共同完成最終的決策,這與人類社會協同合作的決策方式極其相似。目前在行人檢測領域成功得到驗證和應用的集成模型僅有集成CNN(Convolutional Neural Network,卷積神經元網絡)模型,它并行地訓練多個CNN模型,然后將每個樣本輸入各CNN模型,最后取輸出的得分中最大、最小或平均值作為該樣本的最終分類結果。基于集成CNN模型的分類算法具體過程包括:
1)準備訓練數據集,用滑動窗口法從原始數據集中提取多尺度的行人和非行人候選框;
2)將每個樣本依次送入CNN進行卷積和pooling計算,得到特征圖;
3)采用不同的dropout比例設置全連接層,然后將從原始樣本中提取的特征圖送入訓練不同的CNN模型;
4)將測試數據集依次送入訓練好的模型中進行行人樣本的分類,每個樣本均得到若干檢測得分,計算得分的最大、最小或平均值作為最終的判別得分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學深圳研究生院,未經北京大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611166903.2/2.html,轉載請聲明來源鉆瓜專利網。





