[發(fā)明專利]基于中心尺度預(yù)測與孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測識(shí)別跟蹤方法在審
| 申請?zhí)枺?/td> | 202010139477.3 | 申請日: | 2020-03-03 | 
| 公開(公告)號: | CN111339975A | 公開(公告)日: | 2020-06-26 | 
| 發(fā)明(設(shè)計(jì))人: | 唐漾;鐘偉民;杜文莉;錢鋒 | 申請(專利權(quán))人: | 華東理工大學(xué) | 
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 | 
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 陸嘉 | 
| 地址: | 200237 *** | 國省代碼: | 上海;31 | 
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 中心 尺度 預(yù)測 孿生 神經(jīng)網(wǎng)絡(luò) 目標(biāo) 檢測 識(shí)別 跟蹤 方法 | ||
本發(fā)明涉及圖像處理與計(jì)算機(jī)視覺領(lǐng)域,更具體的說,涉及一種基于中心尺度預(yù)測與孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測識(shí)別跟蹤方法。本方法包括:S1采用中心尺度預(yù)測算法模型進(jìn)行目標(biāo)檢測,標(biāo)記所有目標(biāo);S2采用K最鄰近算法模型對待檢測圖像進(jìn)行目標(biāo)識(shí)別,確定特定目標(biāo);S3采用全卷積孿生神經(jīng)網(wǎng)絡(luò)掩膜算法模型進(jìn)行特定目標(biāo)跟蹤。本發(fā)明提出的方法,使用一種基于卷積神經(jīng)網(wǎng)絡(luò)的中心尺度預(yù)測方法進(jìn)行行人檢測,使用K最近鄰方法進(jìn)行行人識(shí)別,使用基于孿生神經(jīng)網(wǎng)絡(luò)的跟蹤方法進(jìn)行行人跟蹤,完成行人的檢測識(shí)別跟蹤的完整過程,對檢測環(huán)境不敏感,檢測、識(shí)別和跟蹤的精度、成功率較高。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理與計(jì)算機(jī)視覺領(lǐng)域,更具體的說,涉及一種基于中心尺度預(yù)測與孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測識(shí)別跟蹤方法。
背景技術(shù)
圖像處理與計(jì)算機(jī)視覺領(lǐng)域的目標(biāo)檢測識(shí)別跟蹤算法,特別是指行人檢測、識(shí)別和跟蹤算法。
行人檢測是為了找出在當(dāng)前幀中行人可能存在的區(qū)域,獲得行人的位置以及尺度大小。
傳統(tǒng)行人檢測方法中常用的有背景減除法和基于形狀的檢測方法:
背景減除法將行人抽象為一類運(yùn)動(dòng)特征,通過濾掉背景將行人提取出來;
基于形狀的檢測方法通過判斷提取的特征是否符合人形。
這類傳統(tǒng)行人檢測方法容易受到環(huán)境變化和圖像分辨率的影響,前者需要從圖像序列當(dāng)中獲取背景信息,不適用于對單幀圖像當(dāng)中的行人進(jìn)行檢測,后者對亮度的敏感度較大。
而基于學(xué)習(xí)特征的方法能夠較好的處理這些問題。
YOLOv3(You?Only?Look?Once?version3,唯一觀察)算法模型借鑒了FPN(特征金字塔網(wǎng)絡(luò)),采用多尺度對不同大小的目標(biāo)進(jìn)行檢測,提高檢測精度。
而Ren?et?al發(fā)表于2015年NIPS(神經(jīng)信息處理系統(tǒng)大會(huì))的文獻(xiàn)《Towards?Real-Time?Object?Detection?with?Region?Proposal?Networks》,提到Faster?R-CNN算法模型采用卷積神經(jīng)網(wǎng)絡(luò)、ReLU(Rec-tified?Linear?Unit,線性修正單元)激活函數(shù)進(jìn)行特征處理,并基于候選框方法實(shí)現(xiàn)行人檢測。Faster?R-CNN算法模型是上述論文中提出的概念,業(yè)界沒有中文表述,均以Faster?R-CNN指代,具體可見引用論文出處。
行人識(shí)別是指將采集到的行人信息與模板或者數(shù)據(jù)庫相比對,獲取行人的屬性或者身份。
當(dāng)前的行人識(shí)別算法一般有三類:特征表示學(xué)習(xí),距離度量學(xué)習(xí)以及深度學(xué)習(xí)算法。
行人跟蹤是指在一串圖像序列中通過某種方法將指定目標(biāo)的位置標(biāo)記出來。
傳統(tǒng)的跟蹤方法有基于特征的方法、基于濾波的方法和基于學(xué)習(xí)特征的方法。
基于特征的方法:通過逐幀提取出跟模板相匹配的特征確定目標(biāo)的位置,但是這種方法與傳統(tǒng)的檢測方法類似,對環(huán)境光度,圖片清晰度的變化較為敏感。
基于濾波的方法跟上述方法相比的優(yōu)勢在于不需要模型的制作,計(jì)算效率較高,跟蹤速度快,但是對于長時(shí)間遮擋的情況較難處理,例如核相關(guān)濾波(KCF)等。
基于學(xué)習(xí)特征的方法則能從圖像當(dāng)中提取出高級特征,其對環(huán)境的適應(yīng)性比較好,例如卷積特征等等。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于中心尺度預(yù)測與孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測識(shí)別跟蹤方法,解決現(xiàn)有技術(shù)對目標(biāo)檢測識(shí)別跟蹤的精度低、成功率低、對檢測環(huán)境較為敏感的技術(shù)問題。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于中心尺度預(yù)測與孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測識(shí)別跟蹤方法,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東理工大學(xué),未經(jīng)華東理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010139477.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
 
- 專利分類
 
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
 - 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
 - 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
 - 基于時(shí)間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
 - 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
 - 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
 - 幀內(nèi)預(yù)測的方法及裝置
 - 圖像預(yù)測方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
 - 文本預(yù)測方法、裝置以及電子設(shè)備
 - 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
 





