[發明專利]一種基于深度學習的端到端網口檢測方法在審
| 申請號: | 201811558348.7 | 申請日: | 2018-12-19 |
| 公開(公告)號: | CN109635875A | 公開(公告)日: | 2019-04-16 |
| 發明(設計)人: | 彭林鵬;翁芳;趙永生;屈帥龍;張衛平 | 申請(專利權)人: | 浙江大學濱海產業技術研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;H04L12/935;H04N5/232 |
| 代理公司: | 天津濱??凭曋R產權代理有限公司 12211 | 代理人: | 楊慧玲 |
| 地址: | 300345 天津市濱海新*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 交換機網口 圖像 網口檢測 端到端 網口 機房 智能巡檢機器人 圖像數據集 巡檢機器人 攝像頭 模型結果 使用數據 數據標簽 算法處理 準確率 機柜 制作 標注 部署 室內 智能 保存 分類 學習 檢測 網絡 | ||
1.一種基于深度學習的端到端網口檢測方法,其特征在于,包括:
(1)獲取機房不同背景、不同機柜的交換機網口圖像;
(2)對交換機網口圖像進行分類;標注每個圖像,制作數據標簽;
(3)使用數據增強技術,制作交換機網口圖像數據集;
(4)訓練深度網絡YOLO v3模型,保存模型結果。
2.根據權利要求1所述的方法,其特征在于,步驟(1)中具體包括:通過調整智能室內巡檢機器人的云臺的高度,同時改變攝像頭的視野角度,獲取機房不同背景、不同機柜的交換機網口圖像。
3.根據權利要求1所述的方法,其特征在于,步驟(2)中所述分類依據網口有無網線、有無遮擋、網線顏色進行劃分,并使用矩形框標注網口。
4.根據權利要求1所述的方法,其特征在于,步驟(3)具體包括:
(3.1)在步驟(1)獲取的交換機網口圖像中選取不同條件下的圖像,組成數據集;
(3.2)使用數據增強技術,將數據集中的每幅圖像依次做水平翻轉、隨機裁剪、平移變換、仿射變換、顏色變換、光照變換、旋轉變換后得到的網口圖像分別存入數據集中;
(3.3)從數據集的所有圖像中隨機選取80%的圖像,組成訓練集,將剩余的20%圖像組成測試集。
5.根據權利要求1所述的方法,其特征在于,步驟(4)具體包括:
(4.1)定義算法目標,算法全部使用均方和誤差作為Loss函數,算法最終迭代Loss函數,使其收斂至最小,Loss函數由三部分組成:坐標誤差、IOU誤差和分類誤差;
(4.2)K-means計算初始化時錨盒anchor boxes尺寸;YOLO v3使用anchor boxes來預測bounding boxes的坐標;
(4.3)初始化訓練參數;設置初始學習率base_lr為0.001,學習率調整策略采用ReduceLROnPlateau,優化器采用隨機梯度下降SGD算法,設定迭代次數step;
(4.4)開始訓練模型;將訓練集圖像與對應標簽類別輸入到深度網絡YOLO v3模型,加載(4.3)中的配置訓練參數,下載ImageNet預訓練權重,在自主搭建的GPU服務器上進行模型訓練;
(4.5)可視化模型檢測結果;載入訓練好的深度網絡YOLO v3模型的訓練參數,將測試集圖像輸入到深度網絡中,通過可視化技術進行檢測;
(4.6)調整訓練網絡模型,如果模型輸出誤差和理想誤差超過允許范圍,則在(4.4)的基礎上繼續訓練,直至模型效果達到要求。
6.一種基于深度學習的端到端網口檢測系統,其特征在于,包括:
獲取模塊,用于獲取機房不同背景、不同機柜的交換機網口圖像;
分類標注模塊,對交換機網口圖像進行分類;標注每個圖像,制作數據標簽;
數據增強模塊,使用數據增強技術,制作交換機網口圖像數據集;
數據訓練模塊,訓練深度網絡YOLO v3模型,保存模型結果。
7.根據權利要求6所述的系統,其特征在于,獲取模塊包括調整單元,用于調整智能室內巡檢機器人的云臺的高度,同時改變攝像頭的視野角度,獲取機房不同背景、不同機柜的交換機網口圖像。
8.根據權利要求6所述的系統,其特征在于,分類標注模塊包括:
分類單元,用于依據網口有無網線、有無遮擋、網線顏色進行劃分;
標注單元,用于使用矩形框標注網口。
9.根據權利要求6所述的系統,其特征在于,數據增強模塊包括:
選取單元,用于在獲取模塊獲取的交換機網口圖像中選取2000張不同條件下的圖像,組成數據集;
增強單元,用于使用數據增強技術,將數據集中的每幅圖像依次做水平翻轉、隨機裁剪、平移變換、仿射變換、顏色變換、光照變換、旋轉變換后得到的網口圖像分別存入數據集中;
集合單元,用于從數據集的所有圖像中隨機選取80%的圖像,組成訓練集,將剩余的20%圖像組成測試集。
10.根據權利要求6所述的系統,其特征在于,數據訓練模塊包括:
算法目標單元,用于定義算法目標,算法全部使用均方和誤差作為Loss函數,算法最終迭代Loss函數,使其收斂至最小,Loss函數由三部分組成:坐標誤差、IOU誤差和分類誤差;
尺寸計算單元,用于K-means計算初始化時錨盒anchor boxes尺寸;YOLO v3使用anchor boxes來預測bounding boxes的坐標;
初始化單元,用于初始化訓練參數;設置初始學習率base_lr為0.001,學習率調整策略采用ReduceLROnPlateau,優化器采用隨機梯度下降,迭代次數step為2000;
訓練單元,用于開始訓練模型;將訓練集圖像與對應標簽類別輸入到深度網絡YOLO v3模型,加載初始化單元中的配置訓練參數,下載ImageNet預訓練權重,在自主搭建的GPU服務器上進行模型訓練;
檢測單元,用于可視化模型檢測結果;載入訓練好的深度網絡YOLO v3模型的訓練參數,將測試集圖像輸入到深度網絡中,通過可視化技術進行檢測;
調整單元,用于調整訓練網絡模型,如果模型輸出誤差和理想誤差超過允許范圍,則在訓練單元的基礎上繼續訓練,直至模型效果達到要求。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學濱海產業技術研究院,未經浙江大學濱海產業技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811558348.7/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





