[發(fā)明專(zhuān)利]一種復(fù)雜環(huán)境下的密集行人檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011296923.8 | 申請(qǐng)日: | 2020-11-18 |
| 公開(kāi)(公告)號(hào): | CN112464770A | 公開(kāi)(公告)日: | 2021-03-09 |
| 發(fā)明(設(shè)計(jì))人: | 王建浩;呼子宇;李占凱;郝若欣;高澤航;牛嘉珩;張翮翔;周濤;代言 | 申請(qǐng)(專(zhuān)利權(quán))人: | 燕山大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 北京專(zhuān)贏專(zhuān)利代理有限公司 11797 | 代理人: | 于剛 |
| 地址: | 066004 河北省秦皇*** | 國(guó)省代碼: | 河北;13 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 復(fù)雜 環(huán)境 密集 行人 檢測(cè) 方法 | ||
本發(fā)明公開(kāi)了一種復(fù)雜環(huán)境下的密集行人檢測(cè)方法,具體過(guò)程如下:首先改進(jìn)YOLOv3算法,監(jiān)控設(shè)備采集到行人圖像,網(wǎng)絡(luò)會(huì)自動(dòng)提取關(guān)鍵幀,然后將圖片傳輸?shù)組SR算法,對(duì)圖片進(jìn)行圖片增強(qiáng)處理,最后再傳輸?shù)礁倪M(jìn)后的YOLOv3算法中并進(jìn)行行人檢測(cè)。本發(fā)明利用YOLOv3與MSR算法相互結(jié)合,最終構(gòu)成了一種對(duì)于復(fù)雜環(huán)境下的密集行人檢測(cè)方法。YOLOv3利用k?means維度聚類(lèi)的方法得到邊界框進(jìn)行更準(zhǔn)確的預(yù)測(cè),使得其速度和精度都有了比較大的提升。多尺度檢測(cè)的應(yīng)用,對(duì)于檢測(cè)有遮擋的目標(biāo)時(shí),檢測(cè)精度依然很高。解決了當(dāng)前在某些復(fù)雜環(huán)境下對(duì)行人的檢測(cè)精度低的問(wèn)題。
技術(shù)領(lǐng)域
本發(fā)明涉及人工智能技術(shù)領(lǐng)域,具體是一種復(fù)雜環(huán)境下的密集行人檢測(cè)方法。
背景技術(shù)
行人檢測(cè)的方法一般可以分為兩種,即基于背景建模的方法和基于統(tǒng)計(jì)學(xué)習(xí)的方法。基于背景建模的方法:將背景建模,提取出前景的行人檢測(cè)目標(biāo),并提取目標(biāo)特征,再用分類(lèi)器對(duì)檢測(cè)到的目標(biāo)進(jìn)行分類(lèi)。其中經(jīng)典算法有Vibe算法,其優(yōu)點(diǎn)就是操作很簡(jiǎn)單,運(yùn)算效率也很高,但是缺點(diǎn)也很凸出,即檢測(cè)區(qū)域內(nèi)的不確定性太多,導(dǎo)致背景變化復(fù)雜,最后的檢測(cè)結(jié)果也就不準(zhǔn)確,例如鬼影問(wèn)題、運(yùn)動(dòng)目標(biāo)不完整問(wèn)題、靜止目標(biāo)問(wèn)題、陰影前景問(wèn)題等等,背景的多變性導(dǎo)致檢測(cè)結(jié)果不準(zhǔn)確是背景建模進(jìn)行行人檢測(cè)的普遍存在問(wèn)題。基于統(tǒng)計(jì)學(xué)習(xí)的方法:此方法主要根據(jù)樣本庫(kù)形成行人檢測(cè)分類(lèi)器。分類(lèi)器包括神經(jīng)網(wǎng)絡(luò)、感知器算法、SVM、RBF、Parzen窗、Adaboost以及現(xiàn)在非常流行的深度學(xué)習(xí)(Deep Learning)。該方法是行人檢測(cè)領(lǐng)域比較普遍的檢測(cè)方法。其中法國(guó)的Dalal提出了HOG+SVM的行人檢測(cè)算法(Histograms of Oriented Gradients for Human Detection,Navneet Dalel,BillTriggs,CVPR2005)取得了很大成就,并且許多后來(lái)研究的行人檢測(cè)算法都是以此為根本思路提出的,例如Wang等人提出的將基于LBP的紋理特征與HOG算子結(jié)合,并且將SVM分類(lèi)器進(jìn)行改進(jìn),從而使其更適合有遮擋的情況;卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)算法的一個(gè)重要算法,LeNet、Alexnet、GoogleNet、VGG等都是CNN的經(jīng)典模型,CNN包含了檢測(cè)精度比較高但是速度有劣勢(shì)的R-CNN,F(xiàn)ast R-CNN,Mask R-CNN,還有基于回歸思想的SSD、YOLO檢測(cè)算法,此處著重闡述YOLO系列檢測(cè)算法。YOLO應(yīng)用了端對(duì)端訓(xùn)練以及推斷并且使用框式目標(biāo)檢測(cè)框架的思路,在YOLO出現(xiàn)之前,有人工構(gòu)建的SIFT、HOG等費(fèi)時(shí)費(fèi)力的模型,后來(lái)有了計(jì)算速度緩慢的R-CNN系列,YOLO的出現(xiàn)成功的解決了精度、速度和成本問(wèn)題。YOLO的出現(xiàn)為目標(biāo)檢測(cè)提出了一個(gè)新思路,即回歸檢測(cè)。YOLO是一個(gè)用卷積層和全連接層結(jié)合的網(wǎng)絡(luò)結(jié)構(gòu)達(dá)到檢測(cè)目的,可以做到端對(duì)端的訓(xùn)練,所以不會(huì)因?yàn)橛?xùn)練而影響計(jì)算速度,其工作過(guò)程則是將給定的輸入圖像劃分為s*s個(gè)網(wǎng)格并輸入到卷積神經(jīng)網(wǎng)絡(luò),得到bounding box、classprobabilities以及confidence score(置信度),置信度反映了模型對(duì)bounding box包含物體的信心程度,以及對(duì)box預(yù)測(cè)的準(zhǔn)確程度,最后篩選box,這是YOLO系列的骨干,兼顧計(jì)算速度和檢測(cè)精度,本發(fā)明優(yōu)選了YOLOv3。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種復(fù)雜環(huán)境下的密集行人檢測(cè)方法,以解決上述背景技術(shù)中提出的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
一種復(fù)雜環(huán)境下的密集行人檢測(cè)方法,具體過(guò)程如下:首先改進(jìn)YOLOv3算法,監(jiān)控設(shè)備采集到行人圖像,網(wǎng)絡(luò)會(huì)自動(dòng)提取關(guān)鍵幀,然后將圖片傳輸?shù)組SR算法,對(duì)圖片進(jìn)行圖片增強(qiáng)處理,最后再傳輸?shù)礁倪M(jìn)后的YOLOv3算法中并進(jìn)行行人檢測(cè)。
作為本發(fā)明的進(jìn)一步技術(shù)方案:所述YOLOv3算法的改進(jìn)方法如下:YOLOv3在檢測(cè)目標(biāo)對(duì)象時(shí),使用softmax函數(shù)計(jì)算各種類(lèi)的概率分布,softmax計(jì)算公式如下:(1);q為單熱分布,輸出結(jié)果中正確的類(lèi)的概率為1而其他類(lèi)為0,使用LSR防止模型把預(yù)測(cè)值過(guò)多的放在大概率的類(lèi)別上,從而把少部分概率放在小概率類(lèi)別上,降低模型過(guò)擬合的程度,公式如下:其中K為總類(lèi)數(shù),ε為常數(shù)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于燕山大學(xué),未經(jīng)燕山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011296923.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種用于清潔消毒的機(jī)器人
- 下一篇:一種市政工程用警示裝置
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)終端和環(huán)境檢測(cè)系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計(jì)裝置和環(huán)境估計(jì)方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車(chē)輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動(dòng)力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)儀(環(huán)境貓)
- 行人畫(huà)像的生成及基于畫(huà)像的行人識(shí)別
- 一種輔助駕駛方法、裝置、車(chē)載終端及車(chē)輛
- 行人跟蹤方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于行人重識(shí)別的跨鏡頭的行人檢索方法
- 行人重識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 行人重識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于深度條件隨機(jī)場(chǎng)的行人重識(shí)別方法和系統(tǒng)
- 行人跟蹤的方法、行人跟蹤裝置以及行人跟蹤系統(tǒng)
- 一種實(shí)時(shí)行人檢測(cè)與重識(shí)別方法及裝置
- 一種行人屬性識(shí)別方法、裝置及電子設(shè)備





