[發(fā)明專利]一種基于非對(duì)稱多流的動(dòng)作檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910458481.3 | 申請(qǐng)日: | 2019-05-29 |
| 公開(kāi)(公告)號(hào): | CN110263666B | 公開(kāi)(公告)日: | 2021-01-19 |
| 發(fā)明(設(shè)計(jì))人: | 王樂(lè);康子健;劉子熠;鄭南寧 | 申請(qǐng)(專利權(quán))人: | 西安交通大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大專利代理有限責(zé)任公司 61200 | 代理人: | 范巍 |
| 地址: | 710049 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 稱多 動(dòng)作 檢測(cè) 方法 | ||
1.一種基于非對(duì)稱多流的動(dòng)作檢測(cè)方法,其特征在于,包括以下步驟:
步驟1,采集若干已標(biāo)注視頻標(biāo)簽的先驗(yàn)視頻,從先驗(yàn)視頻的幀信息中提取RGB圖像和光流;通過(guò)提取的RGB圖像并結(jié)合視頻標(biāo)簽訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),獲得訓(xùn)練好的RGB圖像單流網(wǎng)絡(luò);通過(guò)提取的光流并結(jié)合視頻標(biāo)簽訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),獲得訓(xùn)練好的光流單流網(wǎng)絡(luò);
步驟2,通過(guò)步驟1獲得的訓(xùn)練好的RGB圖像單流網(wǎng)絡(luò)和光流單流網(wǎng)絡(luò),分別提取步驟1采集的先驗(yàn)視頻中每幀的圖像流特征信息和光流特征信息;
步驟3,根據(jù)步驟2提取的圖像流特征信息和光流特征信息,并結(jié)合動(dòng)作標(biāo)簽,訓(xùn)練非對(duì)稱雙流網(wǎng)絡(luò),最終獲得訓(xùn)練好的非對(duì)稱雙流網(wǎng)絡(luò);其中,非對(duì)稱雙流網(wǎng)絡(luò)訓(xùn)練的過(guò)程包括:將圖像流特征信息和光流特征信息結(jié)合作為輸入,輸出多流分類結(jié)果和多流注意力權(quán)重,加權(quán)多流分類結(jié)果獲得視頻分類向量,最小化非對(duì)稱雙流網(wǎng)絡(luò)的損失函數(shù);
步驟4,通過(guò)步驟1獲得的訓(xùn)練好的RGB圖像單流網(wǎng)絡(luò)和光流單流網(wǎng)絡(luò),分別提取待檢測(cè)的目標(biāo)視頻中每幀的圖像流特征信息和光流特征信息;
步驟5,根據(jù)步驟4提取的圖像流特征信息和光流特征信息,獲得目標(biāo)視頻的段特征;將目標(biāo)視頻的段特征輸入步驟3獲得的訓(xùn)練好的非對(duì)稱雙流網(wǎng)絡(luò),輸出段分類向量和段注意力權(quán)重;根據(jù)段分類向量和段注意力權(quán)重計(jì)算獲得視頻分類向量;
步驟6,從步驟5獲得的視頻分類向量中選擇置信度大于預(yù)設(shè)值的動(dòng)作作為潛在動(dòng)作;其中,對(duì)于潛在動(dòng)作a,從步驟5中獲得的段分類向量中抽取潛在動(dòng)作a的分類權(quán)重,獲得潛在動(dòng)作a的動(dòng)作識(shí)別序列;通過(guò)潛在動(dòng)作a的動(dòng)作識(shí)別序列完成動(dòng)作a的檢測(cè);
其中,步驟3的非對(duì)稱雙流網(wǎng)絡(luò)訓(xùn)練的過(guò)程中,圖像流和光流信息結(jié)合的方式為:將光流特征信息作為主信息流;將圖像流特征信息和光流特征信息進(jìn)行降維與融合后,作為輔助信息流;將主信息流與輔助信息流拼合獲得雙流特征信息;
步驟3中,非對(duì)稱雙流網(wǎng)絡(luò)的訓(xùn)練過(guò)程包括:
對(duì)輸入的多流信息非對(duì)稱降維和融合,所述多流信息包括主信息流和輔助信息流;其中,非對(duì)稱降維表示不同流信息降維比例不同,融合指使用相加、拼接或神經(jīng)網(wǎng)絡(luò)合并特征向量;
使用分類神經(jīng)網(wǎng)絡(luò)處理融合了非對(duì)稱雙流信息的特征向量,輸出對(duì)應(yīng)輸入特征的分類向量x和注意力權(quán)重λ;
通過(guò)softmax方法對(duì)分類向量和注意力權(quán)重歸一化;通過(guò)對(duì)來(lái)自視頻中多個(gè)的分類向量和注意力權(quán)重進(jìn)行加權(quán)求和,獲得視頻分類向量。
2.根據(jù)權(quán)利要求1所述的一種基于非對(duì)稱多流的動(dòng)作檢測(cè)方法,其特征在于,步驟6中還包括:使用閾值將獲得的動(dòng)作識(shí)別序列中的誤動(dòng)作剔除,獲得剔除誤動(dòng)作后的動(dòng)作識(shí)別序列;對(duì)剔除誤動(dòng)作后的動(dòng)作識(shí)別序列進(jìn)行最近鄰插值,獲得與目標(biāo)視頻幀數(shù)一一對(duì)應(yīng)的激活序列;根據(jù)激活序列提取獲得動(dòng)作片段和動(dòng)作片段置信度。
3.根據(jù)權(quán)利要求2所述的一種基于非對(duì)稱多流的動(dòng)作檢測(cè)方法,其特征在于,步驟6中使用的閾值為經(jīng)驗(yàn)值或自適應(yīng)閾值;
其中,自適應(yīng)閾值在非對(duì)稱雙流網(wǎng)絡(luò)訓(xùn)練時(shí)統(tǒng)計(jì),具體步驟包括:
預(yù)設(shè)自適應(yīng)閾值比例為pth,pth表示自適應(yīng)閾值所對(duì)應(yīng)的分位數(shù),分位數(shù)為小于1大于0的小數(shù);
統(tǒng)計(jì)所有先驗(yàn)視頻的注意力權(quán)重,注意力權(quán)重序列其中λt為序列中得第t位;對(duì)序列K重新排序,使得λi<λj,i<j,其中i,j為排序后得序號(hào);
取排在第[m*pth]位的權(quán)重為自適應(yīng)權(quán)重;其中,[]表示取整。
4.根據(jù)權(quán)利要求1所述的一種基于非對(duì)稱多流的動(dòng)作檢測(cè)方法,其特征在于,步驟3中,
獲得輔助信息流的步驟包括:將輸入的光流特征和圖像流特征降維,使用全連接或雙線性神經(jīng)網(wǎng)絡(luò)融合降維的光流特征和特性特征;
另外,輔助信息流降維比例大于主信息流的降維比例;輔助信息流降維比例大于0且小于1/4。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安交通大學(xué),未經(jīng)西安交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910458481.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 對(duì)稱多筒瓦
- 非對(duì)稱多入多出無(wú)線通信
- 不對(duì)稱多柵極晶體管及其形成方法
- 不對(duì)稱多刃刀具刃磨的方法及數(shù)控磨床
- 故障診斷系統(tǒng)、用于車輛的電子控制單元、故障診斷方法
- 持氣率光學(xué)傳感儀集成光學(xué)測(cè)井系統(tǒng)
- 一種基于中心對(duì)稱多胞體的故障檢測(cè)閾值計(jì)算方法
- 一種基于單個(gè)反對(duì)稱多模周期波導(dǎo)微腔的上下路濾波器
- 一種生產(chǎn)車間移動(dòng)機(jī)器人基于多胞-橢球雙濾波的位姿定位方法
- 一種基于濾波的工業(yè)時(shí)滯系統(tǒng)故障檢測(cè)方法
- 往復(fù)動(dòng)作體的動(dòng)作機(jī)構(gòu)
- 動(dòng)作判定系統(tǒng)、動(dòng)作判定裝置以及動(dòng)作判定方法
- 動(dòng)作驗(yàn)證裝置、動(dòng)作驗(yàn)證方法、以及動(dòng)作驗(yàn)證系統(tǒng)
- 動(dòng)作檢驗(yàn)裝置、動(dòng)作檢驗(yàn)方法及動(dòng)作檢驗(yàn)程序
- 動(dòng)作輸入裝置、動(dòng)作輸入方法
- 動(dòng)作檢測(cè)系統(tǒng)、動(dòng)作檢測(cè)裝置、動(dòng)作檢測(cè)方法以及動(dòng)作檢測(cè)程序
- 動(dòng)作分析裝置、動(dòng)作分析方法及動(dòng)作分析程序
- 動(dòng)作分析裝置、動(dòng)作分析方法、動(dòng)作分析程序及動(dòng)作分析系統(tǒng)
- 動(dòng)作分析裝置、動(dòng)作分析方法、存儲(chǔ)介質(zhì)及動(dòng)作分析系統(tǒng)
- 動(dòng)作分析裝置、動(dòng)作分析方法及動(dòng)作分析程序
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)





