[發(fā)明專利]基于圖建模的視頻指紋方法有效
| 申請?zhí)枺?/td> | 201210132008.4 | 申請日: | 2012-04-28 |
| 公開(公告)號: | CN102682298A | 公開(公告)日: | 2012-09-19 |
| 發(fā)明(設(shè)計)人: | 聶秀山;孫建德 | 申請(專利權(quán))人: | 聶秀山 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06F17/30 |
| 代理公司: | 濟南圣達知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 李健康 |
| 地址: | 250014 山東省濟南市歷*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 建模 視頻 指紋 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種視頻指紋方法,尤其涉及一種基于圖建模的視頻指紋方法,屬于視頻、多媒體信號處理技術(shù)領(lǐng)域。
背景技術(shù)
隨著計算機與信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為日常生活中不可或缺的一部分,特別是隨著多媒體技術(shù)的迅速發(fā)展,互聯(lián)網(wǎng)視頻網(wǎng)站越來越多,視頻內(nèi)容變的越來越豐富,但隨之而來的網(wǎng)絡(luò)信息安全問題也變的日漸突出。網(wǎng)絡(luò)用戶可以隨意的下載、編輯視頻并再次上傳,由此網(wǎng)絡(luò)中出現(xiàn)大量“垃圾視頻”,據(jù)統(tǒng)計,在某些熱點視頻的檢索結(jié)果中,視頻拷貝的比例甚至高達93%,這大大降低了視頻檢索的效率。同時,由于互聯(lián)網(wǎng)上對于海量視頻的管理缺乏規(guī)劃和統(tǒng)一性,常常引起一些諸如知識產(chǎn)權(quán)等的糾紛,盜版和非法下載的出現(xiàn)也危害了版權(quán)所有者的利益,挫傷了創(chuàng)新的積極性。去除網(wǎng)絡(luò)中的“垃圾視頻”以及打擊盜版進行有效的版權(quán)管理從本質(zhì)上來說都是視頻內(nèi)容認證和識別問題。基于內(nèi)容的視頻指紋技術(shù)正是解決上述問題的主要方法。
基于內(nèi)容的視頻指紋(Content?Based?Video?Fingerprinting:CBVF),又被稱為視頻哈希(Video?Hashing),與數(shù)字視頻水印不同,它不需要在視頻發(fā)布或傳播之前,人工地在視頻對象中嵌入附加信息,因此,CBVF對于尚未發(fā)布和已經(jīng)發(fā)布的視頻都有效;同時,由于不需要在視頻上嵌入附加信息,CBVF解決了數(shù)字視頻水印技術(shù)中水印的不可見性和魯棒性之間的矛盾,從而提高了CBVF對于常見攻擊的魯棒性。利用CBVF技術(shù)不但可以在視頻檢索中搜索到多余的視頻拷貝,并將其屏蔽,而且有助于規(guī)范數(shù)字視頻版權(quán)、傳播等的管理;同時,從另一個方面,也可以通過CBVF來對商業(yè)視頻及其視頻拷貝進行跟蹤分析,以獲得有價值的營銷策略信息。因此,在個人視頻制作與網(wǎng)絡(luò)傳播日益流行的情況下,CBVF具有重要的理論價值和應(yīng)用價值,近年來已經(jīng)成為了多媒體信息處理領(lǐng)域的研究熱點,各種算法也相繼被提出,目前的視頻指紋算法大多都是基于關(guān)鍵幀的,但是關(guān)鍵幀的選取依賴于鏡頭的分割,且鏡頭分割是一個復(fù)雜的過程,鏡頭分割的好壞對關(guān)鍵幀的影響很大。本發(fā)明提出了一種基于二叉樹理論的關(guān)鍵幀選取的方法,該方法避開了鏡頭的分割,且具有成熟的圖論理論支持。另一方面,前景圖像是人關(guān)注的主要對象,而目前的視頻指紋算法恰恰忽略了人的關(guān)注特性,本發(fā)明正是基于前景圖像這一人的關(guān)注對象來提取視頻指紋的,這也是本發(fā)明的優(yōu)勢之一。
視頻由大量的幀組成,幀格式各種各樣,但是從宏觀的角度來看,可以把視頻的每一幀當作高維空間中的一個點,點的坐標由幀的某種屬性決定,點與點之間根據(jù)幀的關(guān)系連線就可以構(gòu)成一個圖。因此,視頻可以看作高維空間里的一個權(quán)重圖。另一方面,視頻幀由若干像素組成,若以像素點為圖頂點,像素點之間關(guān)系定義邊,則幀也可以看作一個權(quán)重圖,本發(fā)明從圖建模的角度入手,利用圖論相關(guān)理論來提取關(guān)鍵幀。視頻的前景圖像反映了視頻的主要內(nèi)容,同時前景圖像也是人的主要關(guān)注對象,本發(fā)明利用前景圖像構(gòu)造視頻指紋。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有視頻拷貝檢測技術(shù)存在的不足,提供一種具有較好的魯棒性和區(qū)分性的基于圖建模的視頻指紋方法。
本發(fā)明的基于圖建模的視頻指紋方法,包括以下步驟:
(1)預(yù)處理:將視頻幀的尺寸標準化,統(tǒng)一幀率,但是不改變視頻內(nèi)容;
(2)視頻關(guān)鍵幀的選?。喊岩曨l建模成無向權(quán)重圖,利用二叉樹來選取視頻關(guān)鍵幀;
(3)利用圖割理論和能量函數(shù)優(yōu)化來提取視頻關(guān)鍵幀的前景圖像,并利用前景圖像的四階累積量的離散余弦變換作為視頻關(guān)鍵幀的特征,進而構(gòu)成視頻的特征;
(4)計算視頻特征序列的峭度作為匹配標簽,對特征序列進行二值量化作為視頻指紋;
(5)對視頻指紋進行分級匹配。
所述步驟(2)的具體實現(xiàn)步驟是:
①以視頻幀為頂點,以幀之間的關(guān)系來構(gòu)造邊,把視頻等價為一個無向權(quán)重圖;
②利用二叉樹選取視頻關(guān)鍵幀;
所述步驟(3)的具體實現(xiàn)步驟是:
①利用圖割理論提取視頻關(guān)鍵幀前景圖像;
②計算前景圖像的四階累積量,并計算四階累積量的離散余弦變換系數(shù)。
所述步驟(4)的具體實現(xiàn)步驟是:
①由每幀四階累積量離散余弦變換的變換系數(shù)中較大的20個系數(shù)構(gòu)造視頻特征向量;
②計算特征向量的峭度,稱為視頻匹配標簽;
③利用密鑰把視頻特征向量量化成一個二值序列,由視頻匹配標簽和二值序列共同構(gòu)成視頻指紋。
所述步驟(5)的具體實現(xiàn)步驟是:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于聶秀山,未經(jīng)聶秀山許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210132008.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





