[發(fā)明專利]一種基于RGB圖像的包裹檢測方法、系統(tǒng)、介質(zhì)及終端在審
| 申請?zhí)枺?/td> | 202110793020.9 | 申請日: | 2021-07-14 |
| 公開(公告)號: | CN113344949A | 公開(公告)日: | 2021-09-03 |
| 發(fā)明(設(shè)計)人: | 張維忠;劉樹杰;袁翠梅;張宏峰 | 申請(專利權(quán))人: | 青島云智聚智能科技有限公司;青島點之云智能科技有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/62;G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 青島鼎尖知識產(chǎn)權(quán)代理有限公司 37318 | 代理人: | 韓海波 |
| 地址: | 266000 山東省青島市嶗山區(qū)松*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 rgb 圖像 包裹 檢測 方法 系統(tǒng) 介質(zhì) 終端 | ||
1.一種基于RGB圖像的包裹檢測方法,其特征在于,所述基于RGB圖像的包裹檢測方法,包括:
步驟一,建立手動標(biāo)記的快遞包裹圖像數(shù)據(jù)集;
步驟二,使用K-means算法對數(shù)據(jù)集的錨框進(jìn)行聚類;
步驟三,使用具有數(shù)據(jù)增強策略的YOLOv3-tiny深層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試。
2.如權(quán)利要求1所述基于RGB圖像的包裹檢測方法,其特征在于,所述步驟三中,YOLOv3的網(wǎng)絡(luò)結(jié)構(gòu)為:YOLOv3算法采用Darknet-53作為基礎(chǔ)網(wǎng)絡(luò),并借鑒了殘差網(wǎng)絡(luò)的方法;
在某些層之間建立了殘留鏈接,Darknet-53的網(wǎng)絡(luò)結(jié)構(gòu)包括53個卷積層和大量3×3,1×1卷積。
3.如權(quán)利要求1所述基于RGB圖像的包裹檢測方法,其特征在于,所述步驟三中,YOLOv3-tiny深層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試包括:YOLOv3的多尺度檢測、包裹檢測和定位增強。
4.如權(quán)利要求3所述基于RGB圖像的包裹檢測方法,其特征在于,所述YOLOv3的多尺度檢測過程為:
YOLOv3使用K-means聚類方法獲得先驗框的大小,并在13×13、26×26和52×52三種不同規(guī)模上進(jìn)行對象預(yù)測;檢測圖像時,首先將輸入圖像劃分為N×N的網(wǎng)格,如果需要預(yù)測C個類別,則會得到的張量個數(shù)為:
N×N×[3×(4+1+C)]
其中,4為目標(biāo)邊框的偏移坐標(biāo);1為置信度,置信度得分是指每個邊框包含一個對象的概率。
5.如權(quán)利要求4所述基于RGB圖像的包裹檢測方法,其特征在于,所述置信度計算公式為:
公式中:表示第i個網(wǎng)格單元的第j個邊界框的置信度:Pr(Object)為預(yù)測目標(biāo)概率;pred為預(yù)測邊框面積;truth為真實邊框面積;IOU為他們交集和并集的比值。
6.如權(quán)利要求3所述基于RGB圖像的包裹檢測方法,其特征在于,所述包裹檢測過程為:
裁剪原始圖像,僅保留感興趣的區(qū)域;At同時,采用差影法提取圖像,公式如下:
I=O-B;
其中:O是原始圖像,B是背景圖像。
7.如權(quán)利要求3所述基于RGB圖像的包裹檢測方法,其特征在于,所述定位增強具體過程為:
對提取的包裹位置進(jìn)行基于RGB-D的顯著性檢測,獲取更準(zhǔn)確的位置信息;
首先使用YOLO處理圖像,裁剪獲得的結(jié)果以最小化其他因素的影響;然后在深度特征提取之前將RGB與D融合以進(jìn)行顯著性檢測來獲得實際邊界。
8.一種基于RGB圖像的包裹檢測系統(tǒng),其特征在于,所述基于RGB圖像的包裹檢測系統(tǒng)包括:
包裹圖像數(shù)據(jù)集構(gòu)建模塊,用于建立手動標(biāo)記的快遞包裹圖像數(shù)據(jù)集;
聚類模塊,用于使用K-means算法對數(shù)據(jù)集的錨框進(jìn)行聚類;
訓(xùn)練和測試模塊,用于使用具有數(shù)據(jù)增強策略的YOLOv3-tiny深層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試。
9.一種接收用戶輸入程序存儲介質(zhì),所存儲的計算機(jī)程序使電子設(shè)備執(zhí)行權(quán)利要求1~7任意一項所述基于RGB圖像的包裹檢測方法包括下列步驟:
步驟一,建立手動標(biāo)記的快遞包裹圖像數(shù)據(jù)集;
步驟二,使用K-means算法對數(shù)據(jù)集的錨框進(jìn)行聚類;
步驟三,使用具有數(shù)據(jù)增強策略的YOLOv3-tiny深層卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試。
10.一種信息數(shù)據(jù)處理終端,其特征在于,所述信息數(shù)據(jù)處理終端包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,所述計算機(jī)程序被所述處理器執(zhí)行時,使得所述處理器執(zhí)行權(quán)利要求1~7任意一項所述基于RGB圖像的包裹檢測方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青島云智聚智能科技有限公司;青島點之云智能科技有限公司,未經(jīng)青島云智聚智能科技有限公司;青島點之云智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110793020.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





