[發(fā)明專利]工業(yè)環(huán)境下基于改進的YOLO-6D算法的目標檢測方法有效
| 申請?zhí)枺?/td> | 202010330520.4 | 申請日: | 2020-04-24 |
| 公開(公告)號: | CN111626120B | 公開(公告)日: | 2023-08-22 |
| 發(fā)明(設計)人: | 吳益飛;叢宇;郭健;陳慶偉;靳懿;吳鑫煜 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06V10/82 | 分類號: | G06V10/82;G06V10/774;G06V10/764;G06N3/0464;G06N3/048;G06N3/082;G06N3/047 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 朱炳斐 |
| 地址: | 210094 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 工業(yè) 環(huán)境 基于 改進 yolo 算法 目標 檢測 方法 | ||
本發(fā)明公開了一種工業(yè)環(huán)境下基于改進的YOLO?6D算法的目標檢測方法,包括以下步驟:采集包含待檢測目標的若干圖像;構建YOLO?6D網絡的訓練數據集;對YOLO?6D網絡進行改進,包括:利用ResNet?53代替ResNet?19的深度殘差神經網絡,將回歸函數以及激活函數中的Softmax替換為Sigmoid;利用訓練數據集對YOLO?6D網絡進行訓練,獲得目標檢測模型;利用目標檢測模型對工業(yè)環(huán)境中的待檢測目標進行檢測,獲取目標的空間信息和分類信息。本發(fā)明通過使用層數更深的深度殘差網絡、增加多梯度尺寸特征圖、改進回歸函數和激活函數,提高了目標檢測的速度和精度,特別是增強了對工業(yè)環(huán)境下的多目標與小目標物體的檢測識別能力,且相對于傳統(tǒng)算法,普適性更優(yōu)。
技術領域
本發(fā)明涉及人工智能領域,具體涉及目標檢測領域,特別涉及一種工業(yè)環(huán)境下基于改進的YOLO-6D算法的目標檢測方法。
背景技術
現代社會的發(fā)展離不開各科基礎科學的積淀,而在計算機視覺中,目標檢測算法正如數學在基礎科學中的重要性。一種高速、高精度、高識別率的目標檢測算法是對整個計算機視覺領域的絕對提升。早期目標檢測算法的工作原理是通過拼接強分類器從而達到區(qū)分的效果,它的缺點是無法檢測到人物等一些系列非剛性目標。基于此問題,有學者提出了HOG+SVM結構,這種結構算法在早期針對道路檢測以及過往行人檢測的方向取得了較大的成功,但在實際使用環(huán)境下始終無法達到要求的實時性與準確性,從而導致計算機視覺的發(fā)展一度停滯。但隨著深度學習的逐步發(fā)展,深度神經網絡識別算法開始出現,大幅提高了目標檢測算法的精度。
其中YOLO是一種全新的深度神經網絡識別算法,相比初代深度學習中RCNN系列需要生成建議框后再進行分類與回歸,其通過自有的結構,解決了RCNN系列步驟過多的問題。但是YOLO算法針對小物體以及對物體鄰近時所進行的特征檢測效果較差;其次,如果當劃分的小格中出現不止一個物體時,小格子會由于設計原因而無法正確分類從而使其識別效果欠佳。此外,在之后的發(fā)展中,因為對立體物體抓取的同時需要判斷目標物體的空間6D姿態(tài),傳統(tǒng)方法將該過程分為兩步,先對物體的外形進行種類識別,但這個過程會造成計算資源浪費與時間損失,大大降低了檢測的速度,實時性差。
綜上所述,現階段所采用的物體空間信息與分類識別方法主要應用于平面信息識別和6D姿態(tài)傳統(tǒng)識別。針對平面信息識別,現有方法對立體物體的識別效果較差;針對6D姿態(tài)傳統(tǒng)識別,現有方法會造成較長的檢測時間以及較大的計算資源浪費。
發(fā)明內容
本發(fā)明的目的在于提供一種具有檢測精度高、普適性高等特點的工業(yè)環(huán)境下的目標檢測方法。
實現本發(fā)明目的的技術解決方案為:工業(yè)環(huán)境下基于改進的YOLO-6D算法的目標檢測方法,所述方法包括以下步驟:
采集包含待檢測目標的若干圖像;
構建YOLO-6D網絡的訓練數據集;
對YOLO-6D網絡進行改進,包括:利用ResNet-53代替ResNet-19的深度殘差神經網絡;
利用所述訓練數據集對YOLO-6D網絡進行訓練,獲得目標檢測模型;
利用所述目標檢測模型對工業(yè)環(huán)境中的待檢測目標進行檢測,獲取目標的空間信息和分類信息。
進一步地,所述訓練數據集包括:所述包含待檢測目標的若干圖像和自定義添加的若干噪聲圖像,以及每一幅圖像對應的標注信息,所述標注信息包括:圖像中是否包含待檢測目標、待檢測目標的空間信息和分類信息。
進一步地,所述ResNet-53包括三個輸出:32倍降采樣后的特征圖作為第一輸出,對32倍降采樣后的特征圖進行步長為2的上采樣,獲得的16倍降采樣后的特征圖作為第二輸出,對16倍降采樣后的特征進行步長為2的上采樣,獲得的8倍降采樣后的特征作為第三輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010330520.4/2.html,轉載請聲明來源鉆瓜專利網。
- 環(huán)境服務系統(tǒng)以及環(huán)境服務事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測終端和環(huán)境檢測系統(tǒng)
- 環(huán)境調整系統(tǒng)、環(huán)境調整方法及環(huán)境調整程序
- 環(huán)境估計裝置和環(huán)境估計方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數據處理
- 環(huán)境取樣動力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測儀(環(huán)境貓)





