[發(fā)明專利]魯棒的媒體指紋有效
| 申請?zhí)枺?/td> | 200980133072.0 | 申請日: | 2009-08-26 |
| 公開(公告)號: | CN102132341A | 公開(公告)日: | 2011-07-20 |
| 發(fā)明(設(shè)計)人: | C·鮑爾;R·拉達(dá)克里希南 | 申請(專利權(quán))人: | 杜比實(shí)驗室特許公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會專利商標(biāo)事務(wù)所 11038 | 代理人: | 楊小明 |
| 地址: | 美國加*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 媒體 指紋 | ||
相關(guān)美國申請
本申請要求于2008年8月26日提交的美國專利臨時申請No.61/091,979的優(yōu)先權(quán)。另外,本申請與于2007年10月5日提交的共同未決的美國專利臨時申請No.60/997,943相關(guān)。特此通過引用并入這兩篇申請的全文。
技術(shù)領(lǐng)域
本發(fā)明整體涉及媒體。更具體地講,本發(fā)明的實(shí)施例涉及音頻(聲學(xué))指紋。
背景技術(shù)
音頻媒體包括本質(zhì)上普遍存在的現(xiàn)代活動特征。多媒體內(nèi)容(例如最現(xiàn)代的電影)包括多于一種類型的媒體,例如包括其視頻內(nèi)容和音頻聲道(soundtrack)二者。幾乎每一類型的現(xiàn)代企業(yè)和許多行業(yè)的個人以多種獨(dú)特且相關(guān)的方式使用音頻媒體內(nèi)容。娛樂、商務(wù)和廣告、教育、教學(xué)和培訓(xùn)、計算和聯(lián)網(wǎng)、廣播、企業(yè)和電信僅僅是在其中音頻媒體內(nèi)容找到普遍使用的幾個現(xiàn)代行為的例子。
音頻媒體包括記錄在各個光盤(CD)上或者以其它存儲格式記錄的、通過網(wǎng)絡(luò)在服務(wù)器和客戶端計算機(jī)之間作為數(shù)字文件流傳輸?shù)摹⒒蛘咄ㄟ^模擬和數(shù)字電磁信號傳輸?shù)囊魳贰⒄Z音和聲音。發(fā)現(xiàn)用戶在移動、上下班往返途中等時用iPodsTM、MP3播放器和CD聽音樂已變得與在家中用娛樂系統(tǒng)、或者其它更固定的音頻再現(xiàn)裝置或較不固定的音頻再現(xiàn)裝置聽音樂一樣熟悉。流行樂隊的演唱會在互聯(lián)網(wǎng)上被流傳輸,并被用戶作為音頻欣賞和/或還在演出網(wǎng)播中被觀看。極其便攜的重量輕的、規(guī)格小的、成本低的數(shù)字音頻文件播放器已廣泛普及。現(xiàn)在本質(zhì)上普遍存在的蜂窩電話、以及個人數(shù)字助理(PDA)和手持計算機(jī)都具有通用的功能。不僅電信裝置,而且現(xiàn)代蜂窩電話也接入互聯(lián)網(wǎng),并從互聯(lián)網(wǎng)流傳輸音頻內(nèi)容。
互聯(lián)網(wǎng)的廣泛且日益增長的使用的結(jié)果是,非常大量的音頻媒體內(nèi)容存在。考慮到存在大量的各種音頻媒體內(nèi)容并且該內(nèi)容隨著時間擴(kuò)大增長,識別內(nèi)容的能力是有價值的。媒體指紋包括識別媒體內(nèi)容的技術(shù)。媒體指紋是從其提取或生成它們的媒體內(nèi)容的唯一標(biāo)識符。從比如在法醫(yī)學(xué)上通過人類指紋唯一地識別人類的意義上來講,術(shù)語“指紋”適用于表示這些媒體內(nèi)容標(biāo)識符的唯一性。盡管與簽名類似,但是媒體指紋可能甚至更密切地并且更可識別地對應(yīng)于內(nèi)容。音頻媒體和視頻媒體均可使用與每種媒體對應(yīng)的媒體指紋來識別。
可通過音頻指紋識別音頻媒體,這里音頻指紋比如可互換地稱為聲學(xué)指紋。從特定音頻波形生成作為與該波形唯一地對應(yīng)的代碼的音頻指紋。本質(zhì)上,音頻指紋從音頻或聲學(xué)波形推導(dǎo)得到。例如,音頻指紋可包括音頻信號的采樣分量。因此,這里所用的音頻指紋可表示原始音頻內(nèi)容文件的相對低比特率表示。因此,相對于存儲從其推導(dǎo)音頻指紋的整個音頻文件或者該音頻文件的部分的成本,存儲和訪問音頻指紋不管怎樣都可以是有效率的或者經(jīng)濟(jì)的。
一旦生成和存儲音頻指紋,以后從其生成指紋的對應(yīng)波形就可通過參照其指紋被識別。可將音頻指紋存儲在例如數(shù)據(jù)庫中。存儲的音頻指紋可以比如通過查詢存儲它們的數(shù)據(jù)庫來訪問,以對與存儲的音頻指紋進(jìn)行比較的音頻采樣進(jìn)行識別、歸類或換句話講分類。因此,聲學(xué)指紋可用于識別用戶正播放的音樂或者其它記錄的、流傳輸?shù)幕蛞云渌绞絺鬏數(shù)囊纛l媒體,管理聲音庫,監(jiān)控廣播、網(wǎng)絡(luò)行為和廣告,以及從與視頻內(nèi)容(例如電影)相關(guān)聯(lián)的音頻內(nèi)容(例如聲道)識別該視頻內(nèi)容。
聲學(xué)指紋的可靠性可以與該聲學(xué)指紋與特定的音頻波形可識別地(比如,唯一地)對應(yīng)的特定性相關(guān)。一些音頻指紋如此精確地提供識別,以至于可依靠它們來識別相同音樂的不同演奏。而且,由于音頻內(nèi)容被人類心理聲學(xué)系統(tǒng)感知,所以一些聲學(xué)指紋基于音頻內(nèi)容。因此,這樣的魯棒的音頻指紋使得可在通過基于感知的音頻編解碼器、甚至涉及有損壓縮的編解碼器(它因此可能趨向于降低音頻內(nèi)容質(zhì)量)對音頻內(nèi)容進(jìn)行壓縮、解壓縮、碼轉(zhuǎn)換和其它改變之后識別該內(nèi)容。
音頻指紋可從被感知編碼的音頻剪輯、序列、分段、部分等推導(dǎo)得到。因此,即使在通過基于感知的音頻編解碼器、甚至涉及有損壓縮的編解碼器(它因此可能趨向于降低音頻內(nèi)容質(zhì)量,該音頻內(nèi)容質(zhì)量的降低實(shí)際上可能對于檢測是感覺不到的)對內(nèi)容進(jìn)行壓縮、解壓縮、碼轉(zhuǎn)換和其它改變之后,也可通過將音頻序列與其指紋進(jìn)行比較來精確地識別該音頻序列。而且,對于與音頻指紋對應(yīng)的內(nèi)容的信號質(zhì)量降低、以及各種攻擊或者諸如離速(off-speed)播放的情形,音頻指紋可以魯棒地工作。
音頻媒體內(nèi)容可以在概念上、商業(yè)上或者其它方面以某種方式與分開的且截然不同的(distinct)內(nèi)容實(shí)例相關(guān)。與音頻內(nèi)容相關(guān)的內(nèi)容可包括,但不限于,其它音頻、視頻或多媒體內(nèi)容。例如,某首歌曲可以以某種概念方式與特定電影相關(guān)。其它示例可以是在某種商業(yè)背景下與給定語音、演講或音樂片段相關(guān)的文本文件或計算機(jī)圖形。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杜比實(shí)驗室特許公司,未經(jīng)杜比實(shí)驗室特許公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200980133072.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





