[發(fā)明專利]一種對基于魯棒哈希函數(shù)的內(nèi)容識別進行建模的方法有效
| 申請?zhí)枺?/td> | 201610029967.1 | 申請日: | 2016-01-18 |
| 公開(公告)號: | CN105631434B | 公開(公告)日: | 2018-12-28 |
| 發(fā)明(設(shè)計)人: | 李岳楠 | 申請(專利權(quán))人: | 天津大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;H04N21/8549 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 魯棒哈希 函數(shù) 內(nèi)容 識別 進行 建模 方法 | ||
本發(fā)明公開了一種對基于魯棒哈希函數(shù)的內(nèi)容識別進行建模的方法,所述建模的方法包括以下步驟:將基于魯棒哈希函數(shù)的內(nèi)容識別等效成在噪聲信道上的傳輸信息,為魯棒哈希函數(shù)建立基于二元對稱信道的分析模型;計算所述基于二元對稱信道的分析模型中的信道轉(zhuǎn)移概率;計算所述基于二元對稱信道的分析模型的容量,利用信息論中的信道編碼定理和Fano不等式,獲取魯棒哈希函數(shù)在內(nèi)容識別中的誤識別率與參考媒體數(shù)目和哈希序列長度之間的關(guān)系。根據(jù)本發(fā)明所提供的建模和分析方法可對魯棒哈希函數(shù)在大規(guī)模媒體數(shù)據(jù)庫上的內(nèi)容識別性能做出預(yù)估,可明確魯棒哈希函數(shù)是否可滿足實際應(yīng)用中設(shè)定的技術(shù)指標(biāo),對媒體搜索、索引和拷貝檢測等應(yīng)用具有指導(dǎo)作用。
技術(shù)領(lǐng)域
本發(fā)明涉及信號與信息處理技術(shù)領(lǐng)域,尤其涉及一種對基于魯棒哈希函數(shù)的內(nèi)容識別進行建模的方法。
背景技術(shù)
隨著媒體(如圖像、音頻和視頻等)分享網(wǎng)站(如YouTube、優(yōu)酷等)的普及和快速發(fā)展,媒體信息的獲取越來越便捷。但是媒體分享網(wǎng)站開放性的特點也帶來了版權(quán)控制的困難。以視頻分享網(wǎng)站為例,任何已注冊用戶都可以向網(wǎng)站上傳視頻。然而,有些用戶上傳的視頻可能是受版權(quán)保護的內(nèi)容(如新近發(fā)行的影視作品)。如果缺乏有效的版權(quán)控制措施,媒體分享網(wǎng)站可能會成為盜版內(nèi)容傳播的平臺。為規(guī)避這一風(fēng)險,媒體分享網(wǎng)站需要隨時對用戶上傳內(nèi)容進行自動檢測,判斷用戶上傳內(nèi)容是否為受版權(quán)保護作品的拷貝版本,這一過程被稱之為拷貝檢測。
多數(shù)媒體分享網(wǎng)站采用魯棒哈希函數(shù)作為拷貝檢測的主要手段。魯棒哈希函數(shù)是一種將媒體信息(如圖像、音頻和視頻等)轉(zhuǎn)化為內(nèi)容摘要的映射,所生成的內(nèi)容摘要(稱之為哈希序列)通常為一個簡短的二值序列(取值0或1)。這種哈希函數(shù)對不影響媒體視聽內(nèi)容的失真(如高質(zhì)量有損壓縮、濾波等)具有魯棒性,故被稱為魯棒哈希函數(shù)。由于魯棒哈希函數(shù)能夠簡潔且穩(wěn)定的描述媒體視聽內(nèi)容,在版權(quán)控制、媒體搜索和索引等內(nèi)容識別應(yīng)用中被廣泛采用。圖1示例了基于魯棒哈希函數(shù)的內(nèi)容識別系統(tǒng)。內(nèi)容識別系統(tǒng)包含一個參考媒體庫和哈希數(shù)據(jù)庫。以媒體分享網(wǎng)站中的內(nèi)容識別系統(tǒng)為例,參考媒體庫中存儲受版權(quán)保護的媒體文件。每個參考媒體在入庫的同時由魯棒哈希函數(shù)計算其哈希序列并存儲至哈希數(shù)據(jù)庫中,這一過程在離線狀態(tài)下完成。內(nèi)容識別為在線環(huán)節(jié):當(dāng)有用戶上傳媒體時,系統(tǒng)首先計算該媒體(稱之為待識別媒體)的哈希序列,并與哈希數(shù)據(jù)庫中所有參考媒體的哈希序列進行比對。對于二值哈希序列,一般采用歸一化漢明距作為距離度量準(zhǔn)則。若待識別媒體和某一參考媒體之間的哈希序列歸一化漢明距小于判決閾值,則判斷待識別媒體為該參考媒體的拷貝,系統(tǒng)會終止用戶上傳或?qū)⑵鋬?nèi)容設(shè)置為付費瀏覽。
文獻(xiàn)中已報道的魯棒哈希函數(shù)方面的工作大部分集中在魯棒哈希函數(shù)設(shè)計方面,在建模和性能分析方面的工作較少。文獻(xiàn)[1]提出一種對旋轉(zhuǎn)和平移等幾何失真的圖像魯棒哈希函數(shù),該算法利用傅里葉-梅林變換提取不變特征,之后利用自適應(yīng)量化器將特征量化至二進制序列。Monga在文獻(xiàn)[2]中提出一種基于特征點的魯棒哈希函數(shù),取特征點響應(yīng)的量化索引作為二進制哈希。文獻(xiàn)[3]中提出的圖像魯棒哈希函數(shù)用隨機Gabor濾波器提取圖像特征,之后對特征矢量進行隨機抖動格型矢量量化以生成哈希。文獻(xiàn)[4]提出一種基于三維離散余弦變換的視頻魯棒哈希函數(shù),該算法首先對視頻做低通濾波、縮放和時域采樣等預(yù)處理,之后對相鄰幀做三維離散余弦變換,在每個變換單元中選取三個低頻系數(shù),哈希序列為對所選系數(shù)做二值化處理之后的結(jié)果。在魯棒哈希函數(shù)性能分析方面:Varna等人以博弈論為基礎(chǔ)的研究表明魯棒哈希函數(shù)應(yīng)保證哈希位以近似相同的概率在0、1間取值,由此可獲得盡可能低的誤識別率[5]。文獻(xiàn)中的工作等以Markov模型為工具對魯棒哈希函數(shù)的碰撞問題進行研究,推導(dǎo)了哈希碰撞概率的解析形式[6]。
發(fā)明人在實現(xiàn)本發(fā)明的過程中,發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在以下缺點和不足:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610029967.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:晶體生長爐具有全行程動平衡的提拉頭部件
- 下一篇:光纜連接保護裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





