[發(fā)明專利]第一人稱視角圖像識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011392225.8 | 申請(qǐng)日: | 2020-12-03 |
| 公開(kāi)(公告)號(hào): | CN112381055A | 公開(kāi)(公告)日: | 2021-02-19 |
| 發(fā)明(設(shè)計(jì))人: | 高瑞東;陳勃霖;蔡錦霖 | 申請(qǐng)(專利權(quán))人: | 影石創(chuàng)新科技股份有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 518101 廣東省深圳市寶安區(qū)新安街道海旺社區(qū)興*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 第一人稱 視角 圖像 識(shí)別 方法 裝置 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開(kāi)了一種第一人稱視角圖像識(shí)別方法,該方法包括:S1:獲取包含多張第一人稱視角的圖像以及多張不包含第一人稱視角的圖像;S2:根據(jù)是否包含手部特征以及手部特征信息對(duì)圖像進(jìn)行分類及標(biāo)注;S3:對(duì)分類及標(biāo)注后的圖像進(jìn)行增強(qiáng)處理以獲得多樣化的圖像訓(xùn)練樣本;S4:將圖像訓(xùn)練樣本輸入預(yù)先構(gòu)建的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到第一視角圖像識(shí)別模型;S5:將待識(shí)別圖像輸入第一視角圖像識(shí)別模型;S6:根據(jù)第一視角圖像識(shí)別模型的輸出判斷待識(shí)別圖像是否為第一人稱視角圖像。與現(xiàn)有技術(shù)相比,本發(fā)明方案可自動(dòng)識(shí)別圖像是否為第一人稱視角,應(yīng)用在視頻上時(shí)可以自動(dòng)判斷當(dāng)前視頻幀是否為第一人稱視角,免除了用于手動(dòng)判斷的需要,用戶只需提供輸入的視頻幀,就可以自動(dòng)區(qū)分該視頻幀是否為第一人稱視角,有利于對(duì)視頻的后期處理,具有處理速度快且準(zhǔn)確率高的優(yōu)點(diǎn)。
技術(shù)領(lǐng)域
本申請(qǐng)涉及視頻識(shí)別技術(shù)領(lǐng)域,具體涉及第一人稱視角圖像識(shí)別方法裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
第一人稱視角簡(jiǎn)稱第一視角(POV,Point of View),原來(lái)的意思是一種視點(diǎn)人物寫(xiě)作手法,簡(jiǎn)單來(lái)說(shuō),就是將相機(jī)安裝在特定的人或動(dòng)物上,記錄從該特定的人或動(dòng)物的視角所看到的一切,第一視角常用于游戲,其在游戲中的定義是:以游戲操作者本人的視角觀看整場(chǎng)游戲演示,相當(dāng)于站在操作者身后看,自己所見(jiàn)即為操作者所見(jiàn)。同樣地,“第一人稱視角視頻”是指通過(guò)用戶穿戴的拍攝裝置拍攝的第一視角(用戶視角)下的視頻數(shù)據(jù)。
隨著可穿戴的拍攝設(shè)備的普及,使用者既可以把可穿戴拍攝設(shè)備佩戴在身上,在登山、沖浪、蹦極等極限運(yùn)動(dòng)中拍攝出“第一人稱視角”的視頻,也可以直接使用可穿戴拍攝設(shè)備直接拍攝非“第一人稱視角”的視頻。由于視角的差異會(huì)造成這兩種視頻在拍攝內(nèi)容上的明顯差異,比如,“第一人稱視角”的視頻更具代入感,更能讓視頻觀看者更直觀地感受拍攝者在拍攝視頻時(shí)的感受,因此,對(duì)這兩種視頻的后期處理方式截然不同。
然而,視頻幀是否為“第一人稱視角”,在圖像上的區(qū)別并不明顯,通過(guò)傳統(tǒng)的計(jì)算機(jī)視覺(jué)方法進(jìn)行區(qū)分,會(huì)相對(duì)繁瑣,而且準(zhǔn)確率不高。
因此,有必要對(duì)現(xiàn)有的第一視角視頻檢測(cè)方法進(jìn)行改進(jìn)。
發(fā)明內(nèi)容
本發(fā)明旨在解決現(xiàn)有第一視角視頻檢測(cè)方法存在的缺陷,提供用于第一人稱視角圖像識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
第一方面,本發(fā)明公開(kāi)了一種第一人稱視角圖像識(shí)別方法,該方法包括:S1:獲取包含多張第一人稱視角的圖像以及多張不包含第一人稱視角的圖像;S2:根據(jù)是否包含手部特征以及手部特征信息對(duì)圖像進(jìn)行分類及標(biāo)注;S3:對(duì)分類及標(biāo)注后的圖像進(jìn)行增強(qiáng)處理以獲得多樣化的圖像訓(xùn)練樣本;S4:將圖像訓(xùn)練樣本輸入預(yù)先構(gòu)建的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到第一視角圖像識(shí)別模型;S5:將待識(shí)別圖像輸入第一視角圖像識(shí)別模型;S6:根據(jù)第一視角圖像識(shí)別模型的輸出判斷待識(shí)別圖像是否為第一人稱視角圖像;其中,所述第一人稱視角圖像為至少包含拍攝者手部特征的照片或視頻幀。
第二方面,本發(fā)明公開(kāi)了一種第一人稱視角圖像識(shí)別裝置,該裝置包括:獲取模塊,用于獲取包含多張第一人稱視角的圖像以及多張不包含第一人稱視角的圖像;分類及標(biāo)注模塊,用于根據(jù)是否包含手部特征以及手部特征信息對(duì)圖像進(jìn)行分類及標(biāo)注;增強(qiáng)處理模塊,用于對(duì)分類及標(biāo)注后的圖像進(jìn)行增強(qiáng)處理以獲得多樣化的圖像訓(xùn)練樣本;訓(xùn)練模塊,用于將圖像訓(xùn)練樣本輸入預(yù)先構(gòu)建的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到第一人稱視角圖像識(shí)別模型;輸入模塊,用于將待識(shí)別圖像輸入第一人稱視角圖像識(shí)別模型;判斷模塊,用于根據(jù)第一視角圖像識(shí)別模型的輸出判斷待識(shí)別圖像是否為第一人稱視角圖像;其中,所述第一人稱視角圖像為至少包含拍攝者手部特征的照片或視頻幀。
第三方面,本發(fā)明公開(kāi)了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有可執(zhí)行指令,所述可執(zhí)行指令被處理器執(zhí)行時(shí)以實(shí)現(xiàn)上述第一人稱視角圖像識(shí)別方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于影石創(chuàng)新科技股份有限公司,未經(jīng)影石創(chuàng)新科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011392225.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 在線第一人稱射擊游戲中匹配多組的系統(tǒng)及方法
- 一種導(dǎo)航方法及系統(tǒng)
- 虛擬現(xiàn)實(shí)系統(tǒng)中顯示用戶移動(dòng)的方法及相關(guān)裝置
- 頭戴式顯示系統(tǒng)、相關(guān)方法及相關(guān)計(jì)算機(jī)可讀取記錄媒體
- 一種操控VR第一人稱視角主體的座椅及操控方法
- 電子裝置及其畫(huà)面視角識(shí)別方法
- 一種醫(yī)療智能眼鏡
- 一種第一人稱拍攝頭盔設(shè)備
- 視頻處理方法、裝置、控制終端、系統(tǒng)及存儲(chǔ)介質(zhì)
- 第一人稱視角圖像識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 多視點(diǎn)視頻的視角切換以及編碼方法和裝置
- 一種斜視角圖像的模擬方法及裝置
- 一種斜視角圖像的模擬方法及裝置
- 一種基于虛擬現(xiàn)實(shí)視頻的多畫(huà)面同時(shí)觀看方法
- 一種基于視圖的特征匹配三維模型檢索方法
- 顯示裝置視角補(bǔ)償計(jì)算的方法、視角補(bǔ)償結(jié)構(gòu)及顯示裝置
- 基于全景照片的動(dòng)畫(huà)生成方法及裝置
- 顯示驅(qū)動(dòng)電路、顯示驅(qū)動(dòng)方法以及液晶顯示裝置
- 一種視角切換方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種虛擬現(xiàn)實(shí)多視角融合模型的設(shè)計(jì)方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





