[發明專利]一種基于深度卷積網絡的半監督行人檢測方法在審
| 申請號: | 201910264411.4 | 申請日: | 2019-04-03 |
| 公開(公告)號: | CN110084131A | 公開(公告)日: | 2019-08-02 |
| 發明(設計)人: | 雷詩謠;吳斯 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 王東東 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標注 訓練集 網絡 行人檢測 半監督 卷積 卷積神經網絡 半監督學習 公共數據集 一致性約束 人工標注 隨機抽取 特征表達 魯棒性 小樣本 減小 擬合 學習 刪除 樣本 保留 改進 | ||
本發明公開了一種基于深度卷積網絡的半監督行人檢測方法,包括,從公共數據集的100%完整的訓練集中隨機抽取5%作為半監督學習的訓練集,保留其標注,作為有標注訓練集,其余的95%作為未標注的訓練集,刪除其標注;采用改進后的RPN卷積神經網絡,加入一致性約束正則項來提高網絡的特征表達能力,從而提升模型的魯棒性,另一方面通過自步學習,減小深度學習網絡的對大量人工標注樣本的依賴性,降低在小樣本的條件下深度學習網絡的過擬合風險。
技術領域
本發明涉及行人檢測領域,具體涉及一種基于深度卷積網絡的半監督行人檢測方法。
背景技術
行人檢測是計算機視覺領域中一個重要課題,在無人駕駛和視頻監控的應用中感知場景信息中的行人檢測是至關重要的一環。無人駕駛需要計算機具備準確識別行人與障礙物的功能,以輔助其他智能駕駛技術對路況進行預判,減少交通事故的發生。目前無人駕駛技術受到了谷歌,百度等眾多公司的青睞,大量科學家正積極研發中。商場,交通等公眾場所都設置監控,用來維持良好的公共秩序,人工處理監控視頻信息的工作,需要投入大量的人力與財力,并且這個工作很容易導致觀測者視覺疲憊,從而漏檢掉許多重要的信息。利用計算機來進行行人檢測,不僅僅大大可以大量減少人力財力的浪費,還能提高準確度。
行人檢測和普通目標對象檢測相比,行人對象在雜亂的背景中更加難以區分,主要挑戰在于行人姿態和視角差異、著裝變化、遮擋等問題。雖然行人檢測的研究已經取得了相當大的進展,但是挑選合適的模型結構和獲取足夠的訓練數據仍然是具有挑戰性的。傳統的行人檢測方法通常基于圖像金字塔使用滑動窗口策略來產生多尺度的目標建議窗口,人工設計特征來提取目標信息,使用支持向量機或集成算法作為分類器,例如:被廣泛應用于Viola-Jonesi框架的無需學習深度特征的Haar-likeii特征通過積分圖的方式實現是一種效率較高且很受歡迎的行人檢測方法。傳統的非端到端行人檢測包括三個階段:第一個階段,在選定的尺度空間內,選取目標窗口,也稱候選窗口和感興趣區域;第二階段,對候選窗口的特征提取階段;第三階段,訓練分類器階段。但這種傳統的方法不僅復雜,而且耗時。2015年,FasterR-CNNiii這個深度學習框架在目標檢測領域取得了很大的成功,它由區域建議網絡(RPN)和Fast R-CNN的分類器兩部分組成。RPN是一種全連接網絡通過在最后一層卷積層的特征映射滑動過濾生成多尺度的候選窗口,被選出的候選窗口的特征進行金字塔池化送入最后的分類器做最后精準的分類。但現有的深度學習模型行人檢測方法非常依賴于訓練數據的規模,這造成一個很大的挑戰:對于在少量的標注樣本和雜亂的背景間得到一個好的模型,標注樣本不足夠的情況,拍攝角度刁鉆的情況下容易誤判出很多假的正類。并且不同于公開的數據集擁有好的拍攝視角并且有足夠的行人樣本來學習豐富的目標信息,大多數的視頻監控都沒有足夠的標注,并且低像素,行人目標尺度小導致類內差別小,從而嚴重降低檢測性能。
發明內容
為了克服現有技術存在的缺點與不足,本發明提供一種基于深度卷積網絡的半監督行人檢測方法。
本發明采用基于端到端的RPN深度卷積網絡,改進RPN深度卷積網絡,并利用自步學習策略來完成半監督學習的任務。
本發明采用如下技術方案:
一種基于深度卷積網絡的半監督行人檢測方法,包括
S1從公共數據集的100%完整的訓練集中隨機抽取5%作為半監督學習的訓練集,保留其標注,作為有標注訓練集,其余的95%作為未標注的訓練集,刪除其標注;
S2采用有標注的訓練集訓練改進后的RPN卷積神經網絡,得到訓練后的RPN卷積神經網絡;
S3采用未標注的訓練集對訓練后的RPN卷積神經網絡進行測試,根據測試得分評估未標注樣本每個候選窗口的置信度,根據置信度判斷正類樣本并貼上偽正類樣本的標簽,否則為偽負類樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910264411.4/2.html,轉載請聲明來源鉆瓜專利網。





