[發(fā)明專利]一種視頻標(biāo)記方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201811581785.0 | 申請(qǐng)日: | 2018-12-24 |
| 公開(kāi)(公告)號(hào): | CN109547845B | 公開(kāi)(公告)日: | 2021-10-01 |
| 發(fā)明(設(shè)計(jì))人: | 張俊峰 | 申請(qǐng)(專利權(quán))人: | 武漢烽火眾智智慧之星科技有限公司 |
| 主分類號(hào): | H04N21/435 | 分類號(hào): | H04N21/435;H04N21/439;H04N21/44;H04N21/4402 |
| 代理公司: | 北京匯澤知識(shí)產(chǎn)權(quán)代理有限公司 11228 | 代理人: | 張濤 |
| 地址: | 430035 湖北省武漢*** | 國(guó)省代碼: | 湖北;42 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 視頻 標(biāo)記 方法 裝置 | ||
1.一種視頻標(biāo)記方法,其特征在于,應(yīng)用于移動(dòng)終端,所述方法包括:
獲得目標(biāo)圖像,記錄所述目標(biāo)圖像的目標(biāo)尺寸,確定所述目標(biāo)圖像的目標(biāo)矩陣;將所述目標(biāo)矩陣分成預(yù)設(shè)數(shù)量個(gè)第一子矩陣,計(jì)算各第一子矩陣的特征值;用各第一子矩陣的特征值構(gòu)成第一向量;
在獲得視頻流后,對(duì)所述視頻流進(jìn)行解析,將解析所得的原始圖像數(shù)據(jù)封裝成各個(gè)單幀圖像;
按照以下方式對(duì)每一單幀圖像添加標(biāo)記:
逐像素掃描該單幀圖像,得到該單幀圖像中尺寸大小為所述目標(biāo)尺寸的各子圖像;
對(duì)于每一子圖像,確定該子圖像的矩陣,將該子圖像的矩陣分成所述預(yù)設(shè)數(shù)量個(gè)第二子矩陣,計(jì)算各第二子矩陣的特征值,用各第二子矩陣的特征值構(gòu)成該子圖像的第二向量;
在獲得各子圖像的第二向量后,計(jì)算各子圖像的第二向量與所述第一向量之間的余弦相似度,作為各子圖像的相似度;確定相似度最大的子圖像在該單幀圖像中所處的目標(biāo)區(qū)域;給該目標(biāo)區(qū)域添加標(biāo)記;具體包括,構(gòu)建二維數(shù)組,將各子圖像的第二向量記錄在所述二維數(shù)組中;遍歷已記錄第二向量的二維數(shù)組,針對(duì)遍歷所得的每一第二向量,計(jì)算該第二向量與所述第一向量之間的余弦相似度,作為該第二向量所屬子圖像的相似度;
具體地,根據(jù)每行/每列掃描出的子圖像的數(shù)量和行數(shù)/列數(shù),確定二維數(shù)組的行數(shù)和列數(shù),二維數(shù)組中的每個(gè)元素對(duì)應(yīng)一個(gè)子圖像的第二向量,可以按照獲得子圖像的順序,按行/列依次將各子圖像的第二向量記錄在所述二維數(shù)組中。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述視頻流進(jìn)行解析,包括:
對(duì)所述視頻流進(jìn)行解協(xié)議,得到封裝數(shù)據(jù);
將所得的封裝數(shù)據(jù)進(jìn)行解封裝,得到音視頻編碼數(shù)據(jù);
對(duì)所述音視頻編碼數(shù)據(jù)進(jìn)行解碼,得到非壓縮的原始圖像數(shù)據(jù)和原始音頻數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在對(duì)每一單幀圖像添加標(biāo)記后,所述方法還包括:
播放所述原始音頻數(shù)據(jù)和添加標(biāo)記后的每一單幀圖像。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述原始圖像數(shù)據(jù)和所述原始音頻數(shù)據(jù)的格式分別為RGB圖像格式和PCM音頻格式。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,給該目標(biāo)區(qū)域添加標(biāo)記,包括:
添加包圍該目標(biāo)區(qū)域的矩形框。
6.一種視頻標(biāo)記裝置,其特征在于,應(yīng)用于移動(dòng)終端,所述裝置包括:
獲得模塊,用于獲得目標(biāo)圖像,記錄所述目標(biāo)圖像的目標(biāo)尺寸,確定所述目標(biāo)圖像的目標(biāo)矩陣;將所述目標(biāo)矩陣分成預(yù)設(shè)數(shù)量個(gè)第一子矩陣,計(jì)算各第一子矩陣的特征值;用各第一子矩陣的特征值構(gòu)成第一向量;
解析模塊,用于在獲得視頻流后,對(duì)所述視頻流進(jìn)行解析,將解析所得的原始圖像數(shù)據(jù)封裝成各個(gè)單幀圖像;
添加標(biāo)記模塊,用于按照以下方式對(duì)每一單幀圖像添加標(biāo)記:逐像素掃描該單幀圖像,得到該單幀圖像中尺寸大小為所述目標(biāo)尺寸的各子圖像;對(duì)于每一子圖像,確定該子圖像的矩陣,將該子圖像的矩陣分成所述預(yù)設(shè)數(shù)量個(gè)第二子矩陣,計(jì)算各第二子矩陣的特征值,用各第二子矩陣的特征值構(gòu)成該子圖像的第二向量;在獲得各子圖像的第二向量后,計(jì)算各子圖像的第二向量與所述第一向量之間的余弦相似度,作為各子圖像的相似度;確定相似度最大的子圖像在該單幀圖像中所處的目標(biāo)區(qū)域;給該目標(biāo)區(qū)域添加標(biāo)記;具體包括,構(gòu)建二維數(shù)組,將各子圖像的第二向量記錄在所述二維數(shù)組中;遍歷已記錄第二向量的二維數(shù)組,針對(duì)遍歷所得的每一第二向量,計(jì)算該第二向量與所述第一向量之間的余弦相似度,作為該第二向量所屬子圖像的相似度;
具體地,根據(jù)每行/每列掃描出的子圖像的數(shù)量和行數(shù)/列數(shù),確定二維數(shù)組的行數(shù)和列數(shù),二維數(shù)組中的每個(gè)元素對(duì)應(yīng)一個(gè)子圖像的第二向量,可以按照獲得子圖像的順序,按行/列依次將各子圖像的第二向量記錄在所述二維數(shù)組中。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述解析模塊對(duì)所述視頻流進(jìn)行解析,具體為:
對(duì)所述視頻流進(jìn)行解協(xié)議,得到封裝數(shù)據(jù);
將所得的封裝數(shù)據(jù)進(jìn)行解封裝,得到音視頻編碼數(shù)據(jù);
對(duì)所述音視頻編碼數(shù)據(jù)進(jìn)行解碼,得到非壓縮的原始圖像數(shù)據(jù)和原始音頻數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢烽火眾智智慧之星科技有限公司,未經(jīng)武漢烽火眾智智慧之星科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811581785.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點(diǎn)播〕
H04N21-20 .專門(mén)適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門(mén)適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機(jī)頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠(yuǎn)程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過(guò)內(nèi)容產(chǎn)生器獨(dú)立于分配過(guò)程實(shí)現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件
- 標(biāo)記裝置及標(biāo)記方法
- 同步數(shù)字體系網(wǎng)絡(luò)標(biāo)記交換的標(biāo)記處理方法
- 標(biāo)記裝置及標(biāo)記方法
- 標(biāo)記頭和標(biāo)記裝置
- 用于通過(guò)標(biāo)記光線標(biāo)記物體的標(biāo)記設(shè)備
- 標(biāo)記裝置以及標(biāo)記方法
- 標(biāo)記系統(tǒng)
- 激光標(biāo)記方法、激光標(biāo)記機(jī)及存儲(chǔ)介質(zhì)
- 用于標(biāo)記標(biāo)記對(duì)象的標(biāo)記系統(tǒng)
- 標(biāo)記方法及標(biāo)記裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





