[發(fā)明專(zhuān)利]基于動(dòng)態(tài)擬合多任務(wù)推理網(wǎng)絡(luò)的多行人識(shí)別方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202110990135.7 | 申請(qǐng)日: | 2021-08-26 |
| 公開(kāi)(公告)號(hào): | CN113807200A | 公開(kāi)(公告)日: | 2021-12-17 |
| 發(fā)明(設(shè)計(jì))人: | 管洪清;徐亮;王偉;孫浩云;張?jiān)?/a>;張慶濤;孫江濤;郝煥萍 | 申請(qǐng)(專(zhuān)利權(quán))人: | 青島文達(dá)通科技股份有限公司 |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08;G06N5/04 |
| 代理公司: | 濟(jì)南圣達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 266500 山*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 動(dòng)態(tài) 擬合 任務(wù) 推理 網(wǎng)絡(luò) 行人 識(shí)別 方法 系統(tǒng) | ||
本發(fā)明公開(kāi)了基于動(dòng)態(tài)擬合多任務(wù)推理網(wǎng)絡(luò)的多行人識(shí)別方法及系統(tǒng),包括:獲取待識(shí)別的視頻流,對(duì)待識(shí)別的視頻幀進(jìn)行解碼生成待識(shí)別的視頻幀序列;將待識(shí)別的視頻幀序列,輸入到訓(xùn)練后的動(dòng)態(tài)擬合多任務(wù)推理神經(jīng)網(wǎng)絡(luò),得到行人檢測(cè)結(jié)果、行人屬性識(shí)別結(jié)果和行人的重識(shí)別結(jié)果。采用多任務(wù)網(wǎng)絡(luò)將行人檢測(cè)、行人屬性識(shí)別、行人重識(shí)別集成為一個(gè)端到端的神經(jīng)網(wǎng)絡(luò),在多行人屬性識(shí)別任務(wù)中,大大提高了檢測(cè)速度。
技術(shù)領(lǐng)域
本發(fā)明涉及視頻處理、人工智能、深度學(xué)習(xí)技術(shù)領(lǐng)域,特別是涉及基于動(dòng)態(tài)擬合多任務(wù)推理網(wǎng)絡(luò)的多行人識(shí)別方法及系統(tǒng)。
背景技術(shù)
本部分的陳述僅僅是提到了與本發(fā)明相關(guān)的背景技術(shù),并不必然構(gòu)成現(xiàn)有技術(shù)。
近些年來(lái),隨著GPU等硬件設(shè)備的的發(fā)展,深度學(xué)習(xí)技術(shù)開(kāi)始崛起。在眾多之領(lǐng)域中,包括圖像分類(lèi),圖像分割,圖像識(shí)語(yǔ)音識(shí)別等,深度神經(jīng)網(wǎng)絡(luò)都取得了目前最好的效果。然而隨著實(shí)際應(yīng)用中的需求越來(lái)越多元化,人們不單單滿足于單純的檢測(cè)功能,多任務(wù)神經(jīng)網(wǎng)絡(luò)應(yīng)運(yùn)而生。在機(jī)器學(xué)習(xí)中,通常關(guān)心優(yōu)化某一特定指標(biāo),不管這個(gè)指標(biāo)是一個(gè)標(biāo)準(zhǔn)值,還是企業(yè)KPI。為了達(dá)到這個(gè)目標(biāo),訓(xùn)練單一模型或多個(gè)模型集合來(lái)完成指定得任務(wù)。然后,通過(guò)精細(xì)調(diào)參,來(lái)改進(jìn)模型直至性能不再提升。
盡管這樣做可以針對(duì)一個(gè)任務(wù)得到一個(gè)可接受得性能,但是可能忽略了一些信息,這些信息有助于在關(guān)心的指標(biāo)上做得更好。具體來(lái)說(shuō),這些信息就是相關(guān)任務(wù)的監(jiān)督數(shù)據(jù)。通過(guò)在相關(guān)任務(wù)間共享表示信息,模型在原始任務(wù)上泛化性能更好,這種方法稱(chēng)為多任務(wù)學(xué)習(xí)。
行人屬性識(shí)別作為監(jiān)控場(chǎng)景下的重要目標(biāo)之一,對(duì)社區(qū)安防、人員監(jiān)控等領(lǐng)域具有重要意義,除此之外,可以通過(guò)行人屬性作為輔助信息用于描述社區(qū)居民人物識(shí)別,定位居民移動(dòng)路徑。在實(shí)際應(yīng)用中,監(jiān)控場(chǎng)景下的多行人屬性識(shí)別需要配合行人檢測(cè)和行人重識(shí)別。行人檢測(cè)是人體屬性識(shí)別的前提,行人重識(shí)別可以追蹤行人軌跡,并且避免重復(fù)識(shí)別產(chǎn)生重復(fù)數(shù)據(jù)。當(dāng)前的人體屬性識(shí)別方案需要配合行人檢測(cè)模型以及行人重識(shí)別模型才能完成針對(duì)監(jiān)控場(chǎng)景中的多行人屬性識(shí)別,最少需要經(jīng)過(guò)三個(gè)模型處理,多次的特征提出,導(dǎo)致效率非常慢。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)的不足,本發(fā)明提供了基于動(dòng)態(tài)擬合多任務(wù)推理網(wǎng)絡(luò)的多行人識(shí)別方法及系統(tǒng);通過(guò)多任務(wù)網(wǎng)絡(luò)將行人檢測(cè)、行人屬性識(shí)別、行人重識(shí)別集成到一個(gè)端到端的單任務(wù)神經(jīng)網(wǎng)絡(luò)。提出特征再提取模塊對(duì)行人屬性特征和行人重識(shí)別特征進(jìn)行再提取,提出動(dòng)態(tài)擬合策略抑制多任務(wù)損失產(chǎn)生的強(qiáng)震蕩,防止梯度爆炸。該方法大大地提高了監(jiān)控場(chǎng)景下多行人屬性識(shí)別的效率。
第一方面,本發(fā)明提供了基于動(dòng)態(tài)擬合多任務(wù)推理網(wǎng)絡(luò)的多行人識(shí)別方法;
基于動(dòng)態(tài)擬合多任務(wù)推理網(wǎng)絡(luò)的多行人識(shí)別方法,包括:
獲取待識(shí)別的視頻流,對(duì)待識(shí)別的視頻幀進(jìn)行解碼生成待識(shí)別的視頻幀序列;
將待識(shí)別的視頻幀序列,輸入到訓(xùn)練后的動(dòng)態(tài)擬合多任務(wù)推理神經(jīng)網(wǎng)絡(luò),得到行人檢測(cè)結(jié)果、行人屬性識(shí)別結(jié)果和行人的重識(shí)別結(jié)果。
第二方面,本發(fā)明提供了基于動(dòng)態(tài)擬合多任務(wù)推理網(wǎng)絡(luò)的多行人識(shí)別系統(tǒng);
基于動(dòng)態(tài)擬合多任務(wù)推理網(wǎng)絡(luò)的多行人識(shí)別系統(tǒng),包括:
獲取模塊,其被配置為:獲取待識(shí)別的視頻流,對(duì)待識(shí)別的視頻幀進(jìn)行解碼生成待識(shí)別的視頻幀序列;
多行人識(shí)別模塊,其被配置為:將待識(shí)別的視頻幀序列,輸入到訓(xùn)練后的動(dòng)態(tài)擬合多任務(wù)推理神經(jīng)網(wǎng)絡(luò),得到行人檢測(cè)結(jié)果、行人屬性識(shí)別結(jié)果和行人的重識(shí)別結(jié)果。
第三方面,本發(fā)明還提供了一種電子設(shè)備,包括:
存儲(chǔ)器,用于非暫時(shí)性存儲(chǔ)計(jì)算機(jī)可讀指令;以及
處理器,用于運(yùn)行所述計(jì)算機(jī)可讀指令,
其中,所述計(jì)算機(jī)可讀指令被所述處理器運(yùn)行時(shí),執(zhí)行上述第一方面所述的方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于青島文達(dá)通科技股份有限公司,未經(jīng)青島文達(dá)通科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110990135.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 動(dòng)態(tài)矢量譯碼方法和動(dòng)態(tài)矢量譯碼裝置
- 動(dòng)態(tài)口令的顯示方法及動(dòng)態(tài)令牌
- 動(dòng)態(tài)庫(kù)管理方法和裝置
- 動(dòng)態(tài)令牌的身份認(rèn)證方法及裝置
- 令牌、動(dòng)態(tài)口令生成方法、動(dòng)態(tài)口令認(rèn)證方法及系統(tǒng)
- 一種動(dòng)態(tài)模糊控制系統(tǒng)
- 一種基于動(dòng)態(tài)信號(hào)的POS機(jī)和安全保護(hù)方法
- 圖像動(dòng)態(tài)展示的方法、裝置、系統(tǒng)及介質(zhì)
- 一種基于POS機(jī)聚合碼功能分離顯示動(dòng)態(tài)聚合碼的系統(tǒng)
- 基于動(dòng)態(tài)口令的身份認(rèn)證方法、裝置和動(dòng)態(tài)令牌
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價(jià)值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種自動(dòng)分配和推送的任務(wù)管理平臺(tái)及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲(chǔ)介質(zhì)
- 基于會(huì)話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)





