[發(fā)明專利]一種視頻標(biāo)記方法及裝置有效
| 申請?zhí)枺?/td> | 201811581785.0 | 申請日: | 2018-12-24 |
| 公開(公告)號: | CN109547845B | 公開(公告)日: | 2021-10-01 |
| 發(fā)明(設(shè)計)人: | 張俊峰 | 申請(專利權(quán))人: | 武漢烽火眾智智慧之星科技有限公司 |
| 主分類號: | H04N21/435 | 分類號: | H04N21/435;H04N21/439;H04N21/44;H04N21/4402 |
| 代理公司: | 北京匯澤知識產(chǎn)權(quán)代理有限公司 11228 | 代理人: | 張濤 |
| 地址: | 430035 湖北省武漢*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 視頻 標(biāo)記 方法 裝置 | ||
本發(fā)明提供了一種視頻標(biāo)記方法及裝置,方法包括:記錄目標(biāo)圖像的目標(biāo)尺寸,將目標(biāo)圖像的目標(biāo)矩陣分成各第一子矩陣,用各第一子矩陣的特征值構(gòu)成第一向量;對所獲得的視頻流進(jìn)行解析,將解析所得的原始圖像數(shù)據(jù)封裝成各單幀圖像;按照以下方式對每一單幀圖像添加標(biāo)記:逐像素掃描該單幀圖像,得到尺寸大小為目標(biāo)尺寸的各子圖像;對于每一子圖像,將該子圖像的矩陣分成各第二子矩陣,用各第二子矩陣的特征值構(gòu)成該子圖像的第二向量;計算各子圖像的第二向量與第一向量之間的余弦相似度,作為各子圖像的相似度;確定相似度最大的子圖像在該單幀圖像中所處的目標(biāo)區(qū)域;給該目標(biāo)區(qū)域添加標(biāo)記。應(yīng)用本發(fā)明實施例,實現(xiàn)了移動終端對視頻流的標(biāo)記。
技術(shù)領(lǐng)域
本發(fā)明涉及視頻處理領(lǐng)域,尤其涉及一種視頻標(biāo)記方法及裝置。
背景技術(shù)
隨著監(jiān)控技術(shù)的快速發(fā)展,視頻數(shù)據(jù)呈海量增長,為了快速的從視頻數(shù)據(jù)中確定待分析目標(biāo),視頻標(biāo)記技術(shù)應(yīng)運而生。待分析目標(biāo)可以是用戶感興趣或想要查找的人、車等等。
目前,應(yīng)用于移動終端(例如手機)的視頻標(biāo)記技術(shù)的相關(guān)研究較少,通常是在電腦上通過人工標(biāo)記的方式,完成視頻標(biāo)記。因此有必要設(shè)計一種視頻標(biāo)記方法,以實現(xiàn)移動終端對視頻流的標(biāo)記。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)之缺陷,提供了一種視頻標(biāo)記方法及裝置,以實現(xiàn)移動終端對視頻流的標(biāo)記。
本發(fā)明是這樣實現(xiàn)的:
第一方面,本發(fā)明提供一種視頻標(biāo)記方法,應(yīng)用于移動終端,所述方法包括:
獲得目標(biāo)圖像,記錄所述目標(biāo)圖像的目標(biāo)尺寸,確定所述目標(biāo)圖像的目標(biāo)矩陣;將所述目標(biāo)矩陣分成預(yù)設(shè)數(shù)量個第一子矩陣,計算各第一子矩陣的特征值;用各第一子矩陣的特征值構(gòu)成第一向量;
在獲得視頻流后,對所述視頻流進(jìn)行解析,將解析所得的原始圖像數(shù)據(jù)封裝成各個單幀圖像;
按照以下方式對每一單幀圖像添加標(biāo)記:逐像素掃描該單幀圖像,得到該單幀圖像中尺寸大小為所述目標(biāo)尺寸的各子圖像;對于每一子圖像,確定該子圖像的矩陣,將該子圖像的矩陣分成所述預(yù)設(shè)數(shù)量個第二子矩陣,計算各第二子矩陣的特征值,用各第二子矩陣的特征值構(gòu)成該子圖像的第二向量;在獲得各子圖像的第二向量后,計算所述各子圖像的第二向量與所述第一向量之間的余弦相似度,作為各子圖像的相似度;確定相似度最大的子圖像在該單幀圖像中所處的目標(biāo)區(qū)域;給該目標(biāo)區(qū)域添加標(biāo)記。
可選的,對所述視頻流進(jìn)行解析,包括:
對所述視頻流進(jìn)行解協(xié)議,得到封裝數(shù)據(jù);
將所得的封裝數(shù)據(jù)進(jìn)行解封裝,得到音視頻編碼數(shù)據(jù);
對所述音視頻編碼數(shù)據(jù)進(jìn)行解碼,得到非壓縮的原始圖像數(shù)據(jù)和原始音頻數(shù)據(jù)。
可選的,在對每一單幀圖像添加標(biāo)記后,所述方法還包括:
播放所述原始音頻數(shù)據(jù)和添加標(biāo)記后的每一單幀圖像。
可選的,所述原始圖像數(shù)據(jù)和所述原始音頻數(shù)據(jù)的格式分別為RGB圖像格式和PCM音頻格式。
可選的,計算各子圖像的第二向量與所述第一向量之間的余弦相似度,作為各子圖像的相似度,包括:
構(gòu)建二維數(shù)組,將各子圖像的第二向量記錄在所述二維數(shù)組中;
遍歷已記錄第二向量的二維數(shù)組,針對遍歷所得的每一第二向量,計算該第二向量與所述第一向量之間的余弦相似度,作為該第二向量所屬子圖像的相似度。
可選的,給該目標(biāo)區(qū)域添加標(biāo)記,包括:
添加包圍該目標(biāo)區(qū)域的矩形框。
第二方面,本發(fā)明提供一種視頻標(biāo)記裝置,應(yīng)用于移動終端,所述裝置包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢烽火眾智智慧之星科技有限公司,未經(jīng)武漢烽火眾智智慧之星科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811581785.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠(yuǎn)程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨立于分配過程實現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件





