[發(fā)明專利]視頻目標(biāo)行為識別方法及電子設(shè)備有效
| 申請?zhí)枺?/td> | 202010043763.X | 申請日: | 2020-01-15 |
| 公開(公告)號: | CN111222487B | 公開(公告)日: | 2021-09-28 |
| 發(fā)明(設(shè)計)人: | 程戰(zhàn)戰(zhàn);盧晶;吳飛;浦世亮;鈕毅 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 傅朝棟;張法高 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 目標(biāo) 行為 識別 方法 電子設(shè)備 | ||
本發(fā)明公開了一種視頻目標(biāo)行為識別方法及電子設(shè)備,該方法包括:獲取待識別視頻,其中,所述視頻包含待識別視頻的圖像幀;通過目標(biāo)檢測模型獲取一個或多個局部目標(biāo)圖像;通過目標(biāo)追蹤模型,對獲取的局部目標(biāo)圖像進行匹配,獲取一個或多個目標(biāo)圖像序列;通過目標(biāo)行為質(zhì)量評分模型,對每個目標(biāo)圖像序列中的目標(biāo)圖像行為進行質(zhì)量評分,獲取高質(zhì)量的目標(biāo)圖像子序列;通過行為識別模型,對獲取的高質(zhì)量目標(biāo)圖像子序列進行行為識別,得到行為識別結(jié)果。該方法僅對視頻目標(biāo)圖像序列中的高質(zhì)量目標(biāo)圖像子序列進行行為識別,一方面消除了低質(zhì)量目標(biāo)行為識別結(jié)果對整體視頻目標(biāo)行為識別結(jié)果的影響;另一方面,由于僅識別高質(zhì)量目標(biāo)行為,可提升了視頻目標(biāo)行為識別效率;該方法能夠滿足用戶的實際應(yīng)用需要,適用性強。
技術(shù)領(lǐng)域
本申請涉及視頻圖像處理技術(shù)領(lǐng)域,特別是涉及視頻目標(biāo)行為識別方法及電子設(shè)備。
背景技術(shù)
隨著視頻圖像技術(shù)的發(fā)展,大量基于視頻的媒體信息不斷出現(xiàn),這使得基于視頻內(nèi)容的行為識別與分析愈發(fā)迫切。視頻中的目標(biāo)行為是一種具體的場景特征,可以用于視頻分析、場景理解及檢索,如果要利用視頻中的目標(biāo)行為信息,一種高效快速的視頻目標(biāo)行為識別技術(shù)尤為關(guān)鍵。傳統(tǒng)的技術(shù)方案通常是先獲取每幀視頻圖像幀中的局部目標(biāo)圖像,然后對每張局部目標(biāo)圖像進行追蹤與識別,最后后處理輸出最終視頻目標(biāo)行為識別結(jié)果;然而,該方案需要逐幀對局部目標(biāo)行為進行識別而耗時增加,直接造成系統(tǒng)的低效率,在實際應(yīng)用中往往不可取。
發(fā)明內(nèi)容
本申請實施例的目的在于提供一種視頻目標(biāo)行為識別方法及電子設(shè)備,以實現(xiàn)視頻目標(biāo)信息的提取與分析。具體技術(shù)方案如下:
第一方面,本申請?zhí)峁┝艘环N視頻目標(biāo)行為識別方法,所述方法包括:
獲取待識別的視頻圖像幀序列;
通過預(yù)先準(zhǔn)備的目標(biāo)檢測模型,對獲取的視頻圖像幀執(zhí)行目標(biāo)檢測,得到每張視頻圖像幀中的一個或多個局部目標(biāo)圖像;所述是指期望獲取的目標(biāo)圖像是視頻圖像幀的局部子圖;
通過預(yù)先準(zhǔn)備的目標(biāo)追蹤模型,對獲取的局部目標(biāo)圖像進行匹配,得到一個或多個目標(biāo)圖像序列;
通過預(yù)先準(zhǔn)備的目標(biāo)行為質(zhì)量評分模型,對每個目標(biāo)圖像序列中的目標(biāo)圖像行為進行質(zhì)量評分,選出質(zhì)量評分滿足預(yù)設(shè)要求的高質(zhì)量目標(biāo)圖像子序列;
通過預(yù)先準(zhǔn)備的行為識別模型,對獲取的高質(zhì)量目標(biāo)圖像子序列進行目標(biāo)行為識別,得到行為識別結(jié)果。
可選的,確定所述預(yù)先準(zhǔn)備的目標(biāo)檢測模型的步驟包括:
獲取多個待訓(xùn)練的視頻圖像幀樣本,稱為第一圖像,并獲取上述第一圖像對應(yīng)的目標(biāo)區(qū)域的位置標(biāo)簽;
將所述第一圖像樣本及對應(yīng)位置標(biāo)簽輸入到預(yù)設(shè)第一神經(jīng)網(wǎng)絡(luò)模型中進行訓(xùn)練,得到預(yù)設(shè)的第一模型;其中,所述預(yù)設(shè)第一神經(jīng)網(wǎng)絡(luò)模型包括特征提取部分和局部目標(biāo)圖像輸出部分;所述特征提取部分用于獲取圖像的深度特征,得到基礎(chǔ)特征圖,所述目標(biāo)圖像輸出部分用于從基礎(chǔ)特征圖解碼出目標(biāo)區(qū)域在原圖中的坐標(biāo)位置,得到局部目標(biāo)圖像,稱為第二圖像。
進一步的,所述通過預(yù)先準(zhǔn)備的目標(biāo)檢測模型,對獲取的視頻圖像幀執(zhí)行目標(biāo)檢測,得到每張視頻圖像幀中的一個或多個局部目標(biāo)圖像,具體包括:
在獲取待檢測的第一圖像時,將所述視頻圖像幀進行特征編碼,得到第一圖像特征圖;
對獲取的第一圖像特征圖進行解碼,得到對應(yīng)的多個局部目標(biāo)圖像,稱為第二圖像。
進一步的,確定所述預(yù)先準(zhǔn)備的目標(biāo)追蹤模型的步驟包括:
獲取多個所述第二圖像樣本及其對應(yīng)的目標(biāo)圖像序列標(biāo)簽,其中,所述目標(biāo)圖像序列標(biāo)簽用于指示第一圖像視頻流中同一局部目標(biāo)形成的局部目標(biāo)圖像序列,也即屬于同一局部目標(biāo)圖像序列的目標(biāo)圖像被分配一個相同ID;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010043763.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





