[發(fā)明專利]一種基于改進(jìn)的YOLOv3網(wǎng)絡(luò)的人數(shù)識(shí)別統(tǒng)計(jì)方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210081157.6 | 申請日: | 2022-01-24 |
| 公開(公告)號: | CN114495003A | 公開(公告)日: | 2022-05-13 |
| 發(fā)明(設(shè)計(jì))人: | 薛陽;王翔;何文;許恒 | 申請(專利權(quán))人: | 上海申視信科技有限公司 |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V10/80;G06V10/762;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州京諾知識(shí)產(chǎn)權(quán)代理有限公司 44407 | 代理人: | 于睿虬 |
| 地址: | 200131 上海市浦東新區(qū)中國(上海)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) yolov3 網(wǎng)絡(luò) 人數(shù) 識(shí)別 統(tǒng)計(jì) 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于改進(jìn)的YOLOv3網(wǎng)絡(luò)的人數(shù)識(shí)別統(tǒng)計(jì)方法及系統(tǒng),所述人數(shù)識(shí)別統(tǒng)計(jì)方法包括:采集人物圖像,對人物圖像進(jìn)行標(biāo)注生成數(shù)據(jù)集,將數(shù)據(jù)集分為訓(xùn)練集和測試集;對訓(xùn)練集進(jìn)行聚類分析,確定目標(biāo)錨值;將YOLOv3網(wǎng)絡(luò)模型中的主干特征提取網(wǎng)絡(luò)Darknet53改進(jìn)為CSPDarknet53,加入空間金字塔池化SPP模塊,生成YOLOv3目標(biāo)檢測優(yōu)化模型;將經(jīng)過聚類分析后的訓(xùn)練集輸入到Y(jié)OLOv3目標(biāo)檢測優(yōu)化模型中進(jìn)行訓(xùn)練,生成人數(shù)識(shí)別統(tǒng)計(jì)模型,并通過測試集對人數(shù)識(shí)別統(tǒng)計(jì)模型進(jìn)行測試。本發(fā)明通過對YOLOv3網(wǎng)絡(luò)模型的改進(jìn),提高了檢測的準(zhǔn)確性和實(shí)時(shí)性。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像識(shí)別領(lǐng)域,尤其涉及一種基于改進(jìn)的YOLOv3網(wǎng)絡(luò)的人數(shù)識(shí)別統(tǒng)計(jì)方法及系統(tǒng)。
背景技術(shù)
人數(shù)識(shí)別統(tǒng)計(jì)在早期主要是以人工檢測為主,這種人工目檢的方式效率低且檢測速度慢,勞動(dòng)強(qiáng)度大,檢測準(zhǔn)確性和實(shí)時(shí)性比較差。近幾十年來,隨著機(jī)器視覺領(lǐng)域的發(fā)展,利用機(jī)器學(xué)習(xí)算法很好的克服了人工目測的缺點(diǎn),機(jī)器視覺的快速檢測技術(shù)得到了越來越多人的青睞,例如一些研究者將模板匹配算法應(yīng)用在人數(shù)識(shí)別統(tǒng)計(jì)。
隨著機(jī)器學(xué)習(xí)的發(fā)展,各種用于人數(shù)識(shí)別統(tǒng)計(jì)的算法也相繼被提出,特別是近幾年來深度學(xué)習(xí)的崛起,卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別方向取得了很大的成功,由其衍生的目標(biāo)檢測算法廣泛應(yīng)用于缺陷檢測領(lǐng)域,例如YOLOv3系列算法以及以Faster-RCNN為代表的檢測算法,使缺陷檢測的實(shí)時(shí)性和準(zhǔn)確性得到進(jìn)一步的提高。
目前CNN(Convolutional Neural Networks)已經(jīng)廣泛應(yīng)用于機(jī)器學(xué)習(xí)、語音識(shí)別、圖像識(shí)別等多個(gè)領(lǐng)域。以CNN為基礎(chǔ)的目標(biāo)檢測算法、人群計(jì)數(shù)算法的發(fā)展也趨于穩(wěn)定,在大部分場景中已有實(shí)際運(yùn)用。在傳統(tǒng)的人群計(jì)數(shù)方法中,常用的有基于檢測的方法和基于回歸的方法?;跈z測的方法通常會(huì)利用SVM和隨機(jī)森林等傳統(tǒng)機(jī)器學(xué)習(xí)方法訓(xùn)練一個(gè)分類器,利用人體的整體或部分結(jié)構(gòu),如頭部、肩膀等提取HOG(His-tograms of OrienteGradients)、邊緣等特征來檢測并統(tǒng)計(jì)人數(shù)。但該方法并不適用于人群遮擋的場景,針對不同尺度大小目標(biāo)的檢測效果并不理想?;诨貧w的方法,其思想是學(xué)習(xí)一種特征到人群數(shù)量的映射,通常是學(xué)習(xí)一個(gè)回歸模型來估計(jì)人群的數(shù)量。相較于傳統(tǒng)機(jī)器學(xué)習(xí)的方法,深度學(xué)習(xí)在計(jì)算機(jī)視覺的識(shí)別、檢測方面取得了很大的進(jìn)步,識(shí)別精度有了很大的提高。無論是使用目標(biāo)檢測的方法還是基于回歸的方法在CNN上都能得到優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)方法的結(jié)果,隨著深度學(xué)習(xí)的不斷發(fā)展,在目標(biāo)檢測等多領(lǐng)域體現(xiàn)出明顯。優(yōu)勢已經(jīng)逐漸開始取代傳統(tǒng)的機(jī)器學(xué)習(xí)方法。
YOLO(You Only Look Once)是Joseph Redmon等人于2015年提出的目標(biāo)檢測算法,最初的版本最多只能檢測49個(gè)目標(biāo)。當(dāng)前,已有YOLOv1、YOLOv2和YOLOv3等多個(gè)版本。最新的版本中YOLOv3調(diào)整了網(wǎng)絡(luò)結(jié)構(gòu),利用多尺度特征進(jìn)行對象檢測并且借鑒了殘差網(wǎng)絡(luò)結(jié)構(gòu),形成更深的網(wǎng)絡(luò)層次。相較于前兩個(gè)版本,YOLOv3可分類的目標(biāo)更多、檢測的目標(biāo)更多、檢測速度更快并且檢測精度也更高。在精確度相當(dāng)?shù)那闆r下,YOLOv3的速度是其它目標(biāo)檢測模型的3、4倍。
YOLOv3通過融合當(dāng)前檢測領(lǐng)域的最新成果,可以實(shí)現(xiàn)精度與速度的良好平衡。YOLOv3使用的是全卷積層,通過修改卷積層的尺寸來實(shí)現(xiàn)特征圖尺寸的修改。YOLOv3網(wǎng)絡(luò)使用的主干特征提取網(wǎng)絡(luò)為Darknet53結(jié)構(gòu),其共有5個(gè)大殘差塊,每個(gè)大殘差塊所包含的小殘差單元個(gè)數(shù)為1、2、8、8、4。YOLOv3主干部分由5個(gè)殘差模塊構(gòu)成,降低梯度爆裂的破壞性,增強(qiáng)網(wǎng)絡(luò)的學(xué)習(xí)能力。
但是YOLOv3的最小特征圖尺寸為13×13,仍然偏大,對于部分中型尺寸甚至較大尺寸物體的檢測結(jié)果精確度不盡人意。同時(shí)具有梯度組合不夠豐富、計(jì)算量較大、特征提取網(wǎng)絡(luò)感受野較小等缺點(diǎn)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的之一在于提供一種基于改進(jìn)的YOLOv3網(wǎng)絡(luò)的人數(shù)識(shí)別統(tǒng)計(jì)方法,用于實(shí)現(xiàn)人數(shù)識(shí)別統(tǒng)計(jì)等功能,通過對YOLOv3網(wǎng)絡(luò)模型的改進(jìn),提高了檢測的準(zhǔn)確性和實(shí)時(shí)性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海申視信科技有限公司,未經(jīng)上海申視信科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210081157.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于知識(shí)蒸餾的文物真?zhèn)舞b定方法
- 基于改進(jìn)YOLOv3網(wǎng)絡(luò)模型的軌道線路病害辨識(shí)方法
- 一種基于YOLOv3的輕量級框架改進(jìn)的目標(biāo)識(shí)別方法
- 基于YOLOv3改進(jìn)的交通標(biāo)志檢測與識(shí)別方法
- 一種基于改進(jìn)的yolov3-tiny網(wǎng)絡(luò)的交通標(biāo)識(shí)檢測方法
- 基于yolov3算法與滑動(dòng)窗口策略的SAR影像海面艦船檢測方法
- 一種基于改進(jìn)YOLOv3網(wǎng)絡(luò)模型識(shí)別鑄件DR圖像疏松缺陷的方法
- 一種基于注意力機(jī)制的多尺度車輛行人檢測方法及裝置
- 一種基于改進(jìn)YOLOv3的小目標(biāo)檢測方法
- 基于YOLOv3算法的PCB表面缺陷檢測方法及裝置
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





