[發(fā)明專(zhuān)利]一種基于弱監(jiān)督學(xué)習(xí)的視頻目標(biāo)檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110759622.2 | 申請(qǐng)日: | 2021-07-05 |
| 公開(kāi)(公告)號(hào): | CN113420707B | 公開(kāi)(公告)日: | 2022-07-15 |
| 發(fā)明(設(shè)計(jì))人: | 朱錦雷;井琨;許野平;朱愛(ài)紅 | 申請(qǐng)(專(zhuān)利權(quán))人: | 神思電子技術(shù)股份有限公司 |
| 主分類(lèi)號(hào): | G06V20/40 | 分類(lèi)號(hào): | G06V20/40;G06V10/774;G06V10/80;G06V10/764;G06V10/82;G06K9/62;G06N3/08 |
| 代理公司: | 濟(jì)南泉城專(zhuān)利商標(biāo)事務(wù)所 37218 | 代理人: | 趙玉鳳 |
| 地址: | 250000 山東省濟(jì)南市*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 監(jiān)督 學(xué)習(xí) 視頻 目標(biāo) 檢測(cè) 方法 | ||
本發(fā)明提供一種基于弱監(jiān)督學(xué)習(xí)的視頻目標(biāo)檢測(cè)方法,通過(guò)設(shè)計(jì)新型注意力網(wǎng)絡(luò)模型,基于較少的全標(biāo)注數(shù)據(jù)及海量簡(jiǎn)單標(biāo)注數(shù)據(jù),使網(wǎng)絡(luò)模型的空間及通道注意力機(jī)制高效工作,從而可以基于海量樣本進(jìn)行弱監(jiān)督訓(xùn)練學(xué)習(xí),取得高精度的目標(biāo)檢測(cè)效果。注意力網(wǎng)絡(luò)模型是實(shí)現(xiàn)高精度物體檢測(cè)的必要技術(shù)手段,但是在目標(biāo)識(shí)別過(guò)程中,所關(guān)注的區(qū)域熱點(diǎn)可能會(huì)受到運(yùn)動(dòng)背景物體的干擾,有些輸入數(shù)據(jù)預(yù)測(cè)結(jié)果較好,而另一些則很差,本方法引入了位置注意力內(nèi)部損失函數(shù),通過(guò)在視頻中跟蹤目標(biāo)區(qū)域,生成用于檢測(cè)的偽定位標(biāo)簽,用于注意力網(wǎng)絡(luò)模型的弱監(jiān)督訓(xùn)練,從而實(shí)現(xiàn)少量標(biāo)注樣本向海量樣本的高效遷移學(xué)習(xí)。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于弱監(jiān)督學(xué)習(xí)的視頻目標(biāo)檢測(cè),屬于圖像分析與機(jī)器學(xué)習(xí)領(lǐng)域。
背景技術(shù)
在圖像分析與識(shí)別領(lǐng)域,有監(jiān)督學(xué)習(xí)一般需要標(biāo)注海量的數(shù)據(jù)。當(dāng)基于視頻流檢測(cè)目標(biāo)或行為時(shí),往往需要對(duì)視頻流中每幀圖像中的目標(biāo)進(jìn)行標(biāo)注,標(biāo)注工作量顯著增加。
通過(guò)半監(jiān)督、弱監(jiān)督、無(wú)監(jiān)督三種學(xué)習(xí)方式,可消除或減少訓(xùn)練模型對(duì)人工標(biāo)注樣本的依賴(lài)。一般認(rèn)為,半監(jiān)督學(xué)習(xí)是在有監(jiān)督學(xué)習(xí)得到模型基礎(chǔ)上,基于新的無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行二次無(wú)監(jiān)督訓(xùn)練得到新的模型。無(wú)監(jiān)督學(xué)習(xí),指算法不依賴(lài)標(biāo)注樣本,自動(dòng)發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)含的規(guī)律,按一定的損失計(jì)算方法進(jìn)行訓(xùn)練模型。弱監(jiān)督一般是基于標(biāo)記不正確、多種標(biāo)記、標(biāo)記不充分、局部標(biāo)記等的數(shù)據(jù)進(jìn)行訓(xùn)練模型。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是提供一種基于弱監(jiān)督學(xué)習(xí)的視頻目標(biāo)檢測(cè)方法,利用特定目標(biāo)在指定區(qū)域內(nèi)視頻片段位置及特征連續(xù)性特點(diǎn),標(biāo)注數(shù)據(jù)時(shí)只需要指定該視頻片段中該目標(biāo)的大概出現(xiàn)的視頻幀位置及目標(biāo)類(lèi)別(幀標(biāo)注),無(wú)需對(duì)視頻每幀圖像進(jìn)行詳細(xì)標(biāo)簽(段標(biāo)注),該弱監(jiān)督訓(xùn)練學(xué)習(xí)方法通過(guò)設(shè)計(jì)網(wǎng)絡(luò)模型與系列損失函數(shù)實(shí)現(xiàn)了與有監(jiān)督學(xué)習(xí)性能相當(dāng)?shù)男Ч?/p>
為了解決所述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案是:一種基于弱監(jiān)督學(xué)習(xí)的視頻目標(biāo)檢測(cè)方法,包括以下步驟:
S01)、輸入視頻片段至基準(zhǔn)模型,基準(zhǔn)模型針對(duì)輸入進(jìn)行視頻目標(biāo)檢測(cè),輸出關(guān)鍵幀中的視頻目標(biāo)位置與類(lèi)別;
S02)、基于基準(zhǔn)模型的輸出計(jì)算損失函數(shù),在損失函數(shù)驅(qū)動(dòng)下對(duì)基準(zhǔn)模型分兩步進(jìn)行訓(xùn)練,首先基于有目標(biāo)位置的帶標(biāo)簽樣本進(jìn)行預(yù)監(jiān)督訓(xùn)練,生成預(yù)訓(xùn)練模型,其次基于預(yù)訓(xùn)練模型和無(wú)目標(biāo)位置標(biāo)簽樣本對(duì)基準(zhǔn)模型進(jìn)行弱監(jiān)督訓(xùn)練,從而實(shí)現(xiàn)對(duì)基準(zhǔn)模型的優(yōu)化。
進(jìn)一步的,步驟S02的預(yù)監(jiān)督訓(xùn)練和弱監(jiān)督訓(xùn)練采用一系列子損失函數(shù)組合,各子函數(shù)分別為:
A、分類(lèi)交叉熵?fù)p失函數(shù),
為了加速計(jì)算,基于對(duì)原始圖像網(wǎng)格化分割的基本思想,將輸入樣本按S×S網(wǎng)格等比例劃分,則相應(yīng)的分類(lèi)交叉熵?fù)p失函數(shù)為:
其中i為輸入樣本劃分網(wǎng)格的標(biāo)號(hào),s2為網(wǎng)格數(shù)目,輸入樣本上鎖定目標(biāo)中心所需要的候選框模板數(shù)目為B,j為候選框模板的標(biāo)號(hào),代表網(wǎng)格標(biāo)號(hào)為i、候選框模板標(biāo)號(hào)為j時(shí),是否存在類(lèi)別為cls的目標(biāo),存在時(shí),否則為0;和Pij分別代表預(yù)測(cè)概率及實(shí)際標(biāo)簽;
B、位置損失函數(shù),
首先,假設(shè)單幀圖像內(nèi)目標(biāo)位置損失如下:
其中,代表網(wǎng)格標(biāo)號(hào)為i、候選框模板標(biāo)號(hào)為j時(shí),是否存在類(lèi)別為cls的目標(biāo),存在時(shí),否則為0,B為鎖定目標(biāo)中心所需要的候選框模板數(shù)目,s2為網(wǎng)格數(shù)目;分別代表樣本中標(biāo)注的橫向中心坐標(biāo)、縱向中心坐標(biāo)、目標(biāo)寬度、目標(biāo)高度及目標(biāo)可信度,代表相應(yīng)的預(yù)測(cè)值;λco為人工指定的加權(quán)系數(shù),即為超參數(shù);
由于輸入樣本是視頻序列片段,它由連續(xù)視頻幀構(gòu)成,所以序列位置損失定位為:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于神思電子技術(shù)股份有限公司,未經(jīng)神思電子技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110759622.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺(jué)訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺(jué)系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





