[發明專利]一種基于深度學習的圖像中目標的識別方法在審
| 申請號: | 201811255139.5 | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN109522938A | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 劉榮;余衛宇 | 申請(專利權)人: | 華南理工大學;廣州飛宇智能科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選區域 卷積神經網絡 圖像 算法 邊框 歸一化處理 過濾操作 候選目標 目標檢測 目標區域 目標圖像 神經網路 輸出目標 特征提取 現實場景 修正目標 優化操作 魯棒性 分類 回歸 卷積 過濾 輸出 學習 檢測 優化 網絡 | ||
本發明公開了一種基于深度學習的圖像中目標的識別方法,步驟如下:輸入一張圖像,使用卷積神經網絡進行候選區域的提取,對輸出的候選區域進行過濾優化操作,同時對每個候選區域進行歸一化處理,將候選區域輸入卷積神經網絡進行特征提取,使用訓練好的分類回歸網絡進行目標圖像的分類和定位和檢測,最后對選取的目標區域進行邊框回歸操作以修正目標區域的位置。本方法采用卷積神經網絡來對圖像中可能包含目標的區域進行提取,減少了候選目標區的數量,同時對卷積神經網路的輸出目標候選區域執行優化過濾操作,提高了算法的計算速度。另外,對目標檢測的候選區域采用多樣的長寬比例和區域大小,更貼近現實場景,提高了算法的魯棒性。
技術領域
本發明涉及圖像處理和計算機視覺技術領域,具體涉及一種基于深度學習的圖像中目標的識別方法。
背景技術
基于深度學習的圖像中目標檢測方法主要用于對圖像中的物體目標進行識別,常見的檢測任務分為三種:識別,定位,檢測,分割。識別:主要對圖像中的物體進行一個類別的劃分。定位:顧名思義就是檢測圖像中的物體的大致位置,傳統的方法是在使用矩形來框來表示圖像中物體的大致位置。檢測:不但要識別圖像中包含哪些物體,還要識別出各物體的大致位置。分割包含語義分割和實例分割,主要解決圖像中像素點和圖像中目標或場景的關系。
圖像中的目標檢測方法中的一個重要環節就是圖像的特征提取。傳統的特征提取主要提取圖像的HOG特征和Haar-like特征,同時其目標識別算法主要包含三步:用滑動窗口提取目標物體的候選區域,對候選區域進行特征提取,分類器進行分類識別。傳統方法采用滑動窗口的形式會產生大量的冗余候選區域,具有計算量大,識別效率低等缺點,阻礙了目標檢測領域發展很長一段時間。
隨著深度學習的火熱,目前大多數的圖像中目標檢測采用的是深度學習的方法來實現,深度學習可以自動的學習到圖像中目標物體的特征,隨著網絡層數的加深,學習特征能力越強,除去了對很多候選區域的重復計算,提高了識別效率和計算速度?;谏疃葘W習的目標識別算法大致分為兩類。第一類主要基于目標區域檢測路線,以R-CNN,SPPNet,Fast-RCNN,Faster-RCNN,FPN為發展路線,識別效率也越來越高,第二類為一體化檢測算法只需要遍歷圖像一次即可,拋棄了以往的候選區域提取的概念,以YOLO,SSD,Retina-Net為代表,該類算法計算速度快,但有些場景下識別效率不高。第一類算法思想依然是目前主流方法,同時第二類算法展現出來的后續發展空間更加廣泛。
圖像中目標識別是計算機視覺一個重要的研究方向,同時在行人檢測,交通檢測,模式識別,軍事,無人駕駛等領域都有著非常廣泛的應用前景。但現實生活場景具有多樣性,光照,環境等因素使物體在圖像的展現差異很大,另方面,同類別的物體間有些相差也是巨大的,這給現實生活中的目標識別應用帶來一定的挑戰性。
發明內容
本發明的目的是為了解決現有技術中的上述缺陷,提供一種基于深度學習的圖像中目標的識別方法。
本發明的目的可以通過采取如下技術方案達到:
一種基于深度學習的圖像中目標的識別方法,所述的識別方法包括下列步驟:
S1、從數據集中選取一系列包含特定目標的圖像,組成數據圖像集,所述的圖像數據集分為測試數據集和訓練數據集;
S2、從訓練數據集中選擇一張包含特定類別目標的RGB圖像作為輸入圖像;
S3、將輸入圖像輸入第一卷積神經網絡進行候選區域提取,得到第一候選區;
S4、將候選區輸入候選區域優化網絡進行候選區的優化過濾操作,得到第二候選區;
S5、對第二候選區進行圖像的歸一化和過濾操作,得到第三候選區;
S6、將第三候選區使用第二卷積神經網絡進行特征圖的提?。?/p>
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學;廣州飛宇智能科技有限公司,未經華南理工大學;廣州飛宇智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811255139.5/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





