[發(fā)明專(zhuān)利]多模態(tài)融合的動(dòng)作識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201810877125.0 | 申請(qǐng)日: | 2018-08-03 |
| 公開(kāi)(公告)號(hào): | CN110795973A | 公開(kāi)(公告)日: | 2020-02-14 |
| 發(fā)明(設(shè)計(jì))人: | 劉家瑛;蔣鴻達(dá);宋思捷;厲揚(yáng)豪;郭宗明 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京大學(xué);北大方正集團(tuán)有限公司;北京北大方正電子有限公司 |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06N3/04 |
| 代理公司: | 11205 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人: | 張芳;劉芳 |
| 地址: | 100871*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多模態(tài) 神經(jīng)網(wǎng)絡(luò)模型 單模態(tài) 訓(xùn)練模型 訓(xùn)練數(shù)據(jù) 預(yù)設(shè) 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 多模態(tài)數(shù)據(jù) 動(dòng)作識(shí)別 流動(dòng)連接 識(shí)別設(shè)備 添加信息 融合 | ||
本發(fā)明提供一種多模態(tài)融合的動(dòng)作識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),方法包括:通過(guò)預(yù)設(shè)的單模態(tài)待訓(xùn)練數(shù)據(jù)對(duì)至少一個(gè)單模態(tài)待訓(xùn)練模型進(jìn)行訓(xùn)練,獲得至少一個(gè)單模態(tài)神經(jīng)網(wǎng)絡(luò)模型;在任意兩個(gè)所述單模態(tài)神經(jīng)網(wǎng)絡(luò)模型之間添加信息流動(dòng)連接,獲得多模態(tài)待訓(xùn)練模型;通過(guò)預(yù)設(shè)的多模態(tài)待訓(xùn)練數(shù)據(jù)對(duì)所述多模態(tài)待訓(xùn)練模型進(jìn)行訓(xùn)練,獲得多模態(tài)神經(jīng)網(wǎng)絡(luò)模型;將待識(shí)別多模態(tài)數(shù)據(jù)添加至所述多模態(tài)神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行識(shí)別。從而能夠?qū)崿F(xiàn)對(duì)多模態(tài)待識(shí)別設(shè)備的處理,提高神經(jīng)網(wǎng)絡(luò)模型的性能。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,尤其涉及一種多模態(tài)融合的動(dòng)作識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著科技的發(fā)展,用于認(rèn)知的人工智能得到了很大的發(fā)展,應(yīng)用新穎的材料和先進(jìn)的技術(shù),認(rèn)知的能力也有了顯著地進(jìn)步,從環(huán)境的認(rèn)知,到人體的認(rèn)知,從靜態(tài)的認(rèn)知,到動(dòng)態(tài)的認(rèn)知。對(duì)于認(rèn)知而言,一個(gè)重要環(huán)節(jié)就是對(duì)人體的認(rèn)知,利用計(jì)算機(jī)視覺(jué)的人工智能在實(shí)際的認(rèn)知中,動(dòng)作的識(shí)別是其中比較重要的一個(gè)部分。人體的動(dòng)作是指身體的活動(dòng)或行動(dòng),在日常的生活,人體本身就是一個(gè)動(dòng)態(tài)的生活過(guò)程,所謂的靜態(tài)也只是動(dòng)態(tài)的一個(gè)銜接過(guò)程。因而,提高認(rèn)知的能力,其中的一個(gè)大問(wèn)題就是人體動(dòng)作的識(shí)別研究。
為了實(shí)現(xiàn)對(duì)動(dòng)作的識(shí)別,現(xiàn)有技術(shù)中一般都是建立動(dòng)作識(shí)別網(wǎng)絡(luò)模型,并對(duì)其進(jìn)行訓(xùn)練,后續(xù)可以將待識(shí)別數(shù)據(jù)添加至動(dòng)作識(shí)別網(wǎng)絡(luò)模型中進(jìn)行識(shí)別。
但是,隨著深度攝像機(jī)的發(fā)展,可以獲取的視頻信息越來(lái)越豐富,除傳統(tǒng)的RGB視頻之外,深度視頻、紅外視頻、人體骨架視頻等視頻模態(tài)也更易獲得。不同模態(tài)的視頻具有不同的特征,以深度視頻為例,相比較RGB視頻,深度視頻去除了紋理信息,但增加了第三維的信息,在刻畫(huà)動(dòng)作時(shí)具有更好的空域表現(xiàn)能力。然而,上述方法只能夠?qū)崿F(xiàn)對(duì)一種模態(tài)的數(shù)據(jù)進(jìn)行動(dòng)作識(shí)別,由于多模態(tài)數(shù)據(jù)在表現(xiàn)形式上的差異性,不同模態(tài)間互補(bǔ)信息的挖掘依然存在困難。
發(fā)明內(nèi)容
本發(fā)明提供一種多模態(tài)融合的動(dòng)作識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于解決現(xiàn)有技術(shù)中由于多模態(tài)數(shù)據(jù)在表現(xiàn)形式上的差異性,不同模態(tài)的待識(shí)別數(shù)據(jù)無(wú)法進(jìn)行動(dòng)作識(shí)別的技術(shù)問(wèn)題。
本發(fā)明的第一個(gè)方面是提供一種多模態(tài)融合的動(dòng)作識(shí)別方法,包括:
通過(guò)預(yù)設(shè)的單模態(tài)待訓(xùn)練數(shù)據(jù)對(duì)至少一個(gè)單模態(tài)待訓(xùn)練模型進(jìn)行訓(xùn)練,獲得至少一個(gè)單模態(tài)神經(jīng)網(wǎng)絡(luò)模型;
在任意兩個(gè)所述單模態(tài)神經(jīng)網(wǎng)絡(luò)模型之間添加信息流動(dòng)連接,獲得多模態(tài)待訓(xùn)練模型;
通過(guò)預(yù)設(shè)的多模態(tài)待訓(xùn)練數(shù)據(jù)對(duì)所述多模態(tài)待訓(xùn)練模型進(jìn)行訓(xùn)練,獲得多模態(tài)神經(jīng)網(wǎng)絡(luò)模型;
將待識(shí)別多模態(tài)數(shù)據(jù)添加至所述多模態(tài)神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行識(shí)別。
本發(fā)明的另一個(gè)方面是提供一種多模態(tài)融合的動(dòng)作識(shí)別裝置,包括:
第一訓(xùn)練模塊,用于通過(guò)預(yù)設(shè)的單模態(tài)待訓(xùn)練數(shù)據(jù)對(duì)至少一個(gè)單模態(tài)待訓(xùn)練模型進(jìn)行訓(xùn)練,獲得至少一個(gè)單模態(tài)神經(jīng)網(wǎng)絡(luò)模型;
連接模塊,用于在任意兩個(gè)所述單模態(tài)神經(jīng)網(wǎng)絡(luò)模型之間添加信息流動(dòng)連接,獲得多模態(tài)待訓(xùn)練模型;
第二訓(xùn)練模塊,用于通過(guò)預(yù)設(shè)的多模態(tài)待訓(xùn)練數(shù)據(jù)對(duì)所述多模態(tài)待訓(xùn)練模型進(jìn)行訓(xùn)練,獲得多模態(tài)神經(jīng)網(wǎng)絡(luò)模型;
識(shí)別模塊,用于將待識(shí)別多模態(tài)數(shù)據(jù)添加至所述多模態(tài)神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行識(shí)別。
本發(fā)明的又一個(gè)方面是提供一種多模態(tài)融合的動(dòng)作識(shí)別裝置,包括:存儲(chǔ)器,處理器;
存儲(chǔ)器;用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器;
其中,所述處理器被配置為由所述處理器執(zhí)行如上述的多模態(tài)融合的動(dòng)作識(shí)別方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京大學(xué);北大方正集團(tuán)有限公司;北京北大方正電子有限公司,未經(jīng)北京大學(xué);北大方正集團(tuán)有限公司;北京北大方正電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810877125.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于智能機(jī)器人系統(tǒng)多模態(tài)輸出的方法及裝置
- 一種基于深度學(xué)習(xí)的多模態(tài)醫(yī)學(xué)影像識(shí)別方法及裝置
- 一種基于多模態(tài)生成式對(duì)抗網(wǎng)絡(luò)的云圖分類(lèi)方法
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 一種有監(jiān)督的快速離散多模態(tài)哈希檢索方法和系統(tǒng)
- 一種多模態(tài)數(shù)據(jù)處理方法及系統(tǒng)
- 一種基于多模態(tài)學(xué)習(xí)的電力攻擊識(shí)別方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種基于門(mén)機(jī)制多模態(tài)融合的情感分析方法
- 面向?qū)捰蝻w行的多模態(tài)精確劃分方法
- 一種對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于無(wú)標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類(lèi)拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置
- 多模態(tài)融合的動(dòng)作識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 基于CPCI總線的可擴(kuò)展的多模態(tài)層析成像系統(tǒng)
- 可擴(kuò)展的多模態(tài)層析成像系統(tǒng)
- 視頻人物檢索方法、介質(zhì)、裝置和計(jì)算設(shè)備
- 語(yǔ)義表示模型的預(yù)訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于變分模態(tài)分解和預(yù)測(cè)性能的單模態(tài)子信號(hào)選擇方法
- 基于跨模態(tài)行人重識(shí)別方法及裝置
- 跨模態(tài)人臉識(shí)別的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 用于視頻分類(lèi)的方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)和程序產(chǎn)品
- 自動(dòng)化的模型訓(xùn)練方法、裝置、設(shè)備及介質(zhì)
- 變換模型訓(xùn)練方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 信息處理裝置和方法以及利用模型分類(lèi)的裝置
- 一種模型訓(xùn)練的方法和裝置
- 模型訓(xùn)練方法、模型訓(xùn)練裝置和實(shí)體抽取方法
- 選擇模型訓(xùn)練方法、模型選擇方法、裝置及電子設(shè)備
- 模型訓(xùn)練方法及裝置
- 模型的訓(xùn)練方法、模型的預(yù)測(cè)方法以及模型的控制系統(tǒng)
- 一種模型生成及電池劣化推測(cè)裝置、方法、介質(zhì)及設(shè)備
- 模型訓(xùn)練方法、模型訓(xùn)練平臺(tái)、電子設(shè)備和存儲(chǔ)介質(zhì)





