[發明專利]一種吊裝物體單階檢測方法、裝置、電子設備及存儲介質有效
| 申請號: | 202011456486.1 | 申請日: | 2020-12-13 |
| 公開(公告)號: | CN112215308B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 徐芬;黎晨陽;張逸;張文廣;王軍;徐曉剛 | 申請(專利權)人: | 之江實驗室 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 應孔月 |
| 地址: | 310023 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 吊裝 物體 檢測 方法 裝置 電子設備 存儲 介質 | ||
1.一種吊裝物體單階檢測方法,其特征在于,包括:
獲取吊裝物體圖像,作為訓練集;
對訓練集進行特征提取,獲得目標坐標及旋轉角度;
使用基于深度卷積神經網絡的檢測模型作為吊裝物體檢測的基線網絡架構,并按旋轉框方式修改檢測模型;具體包括:選擇 YOLOv3 深度卷積神經網絡作為吊裝物體檢測的基線網絡架構,按旋轉框方式修改檢測模型,其中主要修改YOLOv3 深度卷積神經網絡中Anchor、YOLO層的張量輸出深度、YOLO層輸出、交并比計算和損失計算五個部分;
使用所述訓練集、目標坐標及旋轉角度對修改后的檢測模型進行訓練,獲得訓練好的檢測模型;
使用訓練好的檢測模型對待檢測的圖像進行檢測,獲得圖像中帶旋轉角度的吊裝物體的檢測結果;
其中,修改YOLOv3 深度卷積神經網絡中Anchor、YOLO層的張量輸出深度、YOLO層輸出、交并比計算和損失計算五個部分,具體包括:
(5.1)修改YOLOv3 深度卷積神經網絡中Anchor;
設計錨點R-Anchor替換YOLO架構中的Anchor,R-Anchor由(w,h,θ)三要素組成;YOLO架構中的Anchor是用k-means方法獲得的聚類中心;R-Anchor增加旋轉尺度,為每個尺寸配置6個角度;
(5.2)修改YOLOv3 深度卷積神經網絡中YOLO層的張量輸出深度;
每個YOLO層的 3個尺度,6個角度的輸出張量深度為3×6×(5+1+N),其中N為類別個數;
(5.3)修改YOLOv3 深度卷積神經網絡中YOLO層輸出;
YOLO層輸出Bounding box的計算公式為:
其中,是bounding box的中心點坐標;是bounding box的寬、高和旋轉角度;是YOLO層輸出張量中代表bounding box中心點坐標的分量;是YOLO層輸出張量中代表bounding box寬、高和旋轉角度的分量;是特征圖中grid cell的坐標;sigmoid函數;是預設的R-Anchor映射到特征圖中的寬、高和旋轉角度;
(5.4)修改YOLOv3 深度卷積神經網絡中交并比計算;
交并比IOU計算公式為:
其中與分別是兩個目標框的位置坐標,∩和∪表示兩個目標框的交集和并集中所包含的像素量;
(5.5)修改YOLOv3 深度卷積神經網絡中損失計算;
損失函數包含目標框損失、置信度損失和目標類別損失三部分;
其中代表損失函數,代表目標框損失,采用GIOU損失計算方式,代表旋轉角度損失,采用smooth L1損失計算方式;代表置信度損失,代表目標類別置信度損失;代表各損失的權重因子。
2.根據權利要求1所述的一種吊裝物體單階檢測方法,其特征在于:獲取吊裝物體圖像,具體包括:
采集吊裝物體的視頻,選取符合條件的圖像,對圖像中吊裝物體進行標注,得到訓練集,其中所述標注的信息是吊裝物體的四個角點坐標(x1,y1,x2,y2,x3,y3,x4,y4)。
3.根據權利要求1所述的一種吊裝物體單階檢測方法,其特征在于:對訓練集進行特征提取,獲得目標坐標及旋轉角度,具體包括:
將四個角點坐標(x1,y1,x2,y2,x3,y3,x4,y4)轉換為(x,y,w,h,θ),其中(x,y)表示目標框的幾何中心,(w,h)為目標框的長邊和短邊,θ是旋轉的角度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于之江實驗室,未經之江實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011456486.1/1.html,轉載請聲明來源鉆瓜專利網。





