[發明專利]一種使用分類圖片提升目標檢測網絡性能的方法有效
| 申請號: | 201710616494.X | 申請日: | 2017-07-26 |
| 公開(公告)號: | CN107392251B | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 李宏亮 | 申請(專利權)人: | 成都快眼科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都九鼎天元知識產權代理有限公司 51214 | 代理人: | 郭彩紅 |
| 地址: | 610200 四川省成都市雙*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 使用 分類 圖片 提升 目標 檢測 網絡 性能 方法 | ||
本發明提供了一種使用分類圖片提升目標檢測網絡性能的方法,具體方法為:訓練好的目標檢測網絡中,針對目標檢測性能最差的目標類別,制作該目標類別的分類圖片數據庫,并把所述目標類別的分類圖片中包含的特征信息學習到所述目標檢測網絡中,擴充網絡中有關所述目標類別目標特征的信息。在訓練目標檢測網絡時,針對檢測性能最差的類別,考慮構造該類別的分類圖片數據庫,并使用目標檢測網絡在該分類圖片數據庫上進行微調,使得目標檢測網絡中關于該類別的特征信息變得更加豐富,提升該類別的目標檢測性能,進而提升目標檢測網絡的整體性能。
技術領域
本發明涉及一種提升目標檢測網絡性能的方法,特別是涉及一種使用分類圖片提升目標檢測網絡性能的方法。
背景技術
目標檢測是計算機視覺的重要應用之一,其目的是通過構建軟件算法,讓計算機系統能夠模仿人類的視覺處理方式,對輸入的圖像進行分析,輸出圖像中目標的位置及類別信息。典型的目標檢測算法框架由特征提取和特征學習兩個部分組成。特征提取部分負責把圖像數據中的原始信息進行提取和變換,得到抽象程度更高、表達能力更強的特征(例如邊緣譜、梯度、特征點、顯著譜等)。特征學習部分利用特征提取部分輸出的特征表示對圖像中可能的目標位置進行判斷,最終輸出目標檢測結果。
傳統的目標檢測方法使用人工設計的特征提取器來提取圖像特征,然后把圖像特征作為樣本來訓練特征學習器。例如,Viola和Jones等人提出了一種快速人臉檢測方法,該方法使用Harr小波從圖像中提取特征并采用AdaBoost算法對特征進行分類得到檢測結果。Dalal等人提出了一種突破性的垂直行人檢測方法,該方法利用滑動窗從圖像的局部區域中提取HoG特征(梯度直方圖,Histogram of Gradient),然后使用SVM(支持向量機,Support Vector Machine)對每個滑動窗區域的HoG特征進行分類得到檢測結果。后來在Dalal等人工作的基礎上,Felzenszwalb等人提出了形變模型DPM(Deformable PartModel),該模型很好地解決了有形變目標的檢測問題。雖然這些方法的出現使得目標檢測性能不斷提升,不過這些方法都需要設計人員手工設計特征提取器,而特征提取器的設計需要設計人員對所需要解決的問題有一定認識,特征提取器設計質量的高低直接決定了目標檢測算法能否正常工作。目標檢測器的性能容易受到人為因素的干預。
近年來,深度學習技術,特別是CNN(卷積神經網絡,Convolutioanl NeuralNetwork)的出現對目標檢測方法的設計產生了深遠的影響。CNN把特征提取和特征學習這兩個部分有機地結合在一起,通過端到端(end-to-end)的學習方式,使得CNN能夠自動從輸入圖像數據中學習得到合適的特征提取算子,并能夠利用提取到的特征訓練分類器。CNN的出現降低了目標檢測方法的設計難度,設計人員無需考慮特征提取器的設計細節,只需要考慮CNN網絡的結構。CNN目標檢測框架種類繁多、結構多樣,常用的CNN目標檢測框架有R-CNN及其衍生結構Fast(er)-RCNN,SSD,YOLO等。不過,所有的CNN目標檢測框架都有一個共同的特點,即檢測性能的好壞與訓練樣本的數據分布有很大的關系。訓練樣本分布不均是限制CNN目標檢測框架性能的重要因素,這主要由客觀原因造成。當前,目標檢測方法的性能都是通過在在多個公開的圖像數據庫中運行算法得到。在這些公開的目標檢測圖像數據庫中,目標類別少,不同類別的訓練樣本個數差異很大,有些樣本數據甚至有誤。其次,公開數據庫中的圖像數據很難反映出日常生活中的真實情形。例如,日常生活中人跌倒的情形是很常見的,而現有的公開數據庫中,包含有人跌倒的圖片的數量是非常少的。即使實驗人員通過多種途徑獲取到這類圖片,為了能夠訓練算法,后面還需要組織大量的人力對獲取的圖片進行目標標注,工作量大、非常耗時。
發明內容
本發明要解決的技術問題是提供一種使用分類圖片提升目標檢測網絡性能的方法,能夠解決現有技術中由于訓練樣本分布不均和訓練樣本難以獲取,造成網絡性能無法進一步提升的問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都快眼科技有限公司,未經成都快眼科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710616494.X/2.html,轉載請聲明來源鉆瓜專利網。





