[發(fā)明專利]提供時間扭曲激活信號以及使用該時間扭曲激活信號對音頻信號編碼有效
| 申請?zhí)枺?/td> | 201210491312.8 | 申請日: | 2009-07-06 |
| 公開(公告)號: | CN103077722A | 公開(公告)日: | 2013-05-01 |
| 發(fā)明(設(shè)計)人: | 斯特凡·拜爾;薩沙·迪施;拉爾夫·蓋格爾;紀(jì)堯姆·福克斯;馬克斯·諾伊恩多夫;杰拉爾德·舒勒;貝恩德·埃德勒 | 申請(專利權(quán))人: | 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會 |
| 主分類號: | G10L19/002 | 分類號: | G10L19/002;G10L21/04 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 潘劍穎 |
| 地址: | 德國*** | 國省代碼: | 德國;DE |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 提供 時間 扭曲 激活 信號 以及 使用 音頻 編碼 | ||
本申請是申請?zhí)枮椤?00980135837.4”,申請日為2011年3月11日,發(fā)明名稱為“提供時間扭曲激活信號以及使用該時間扭曲激活信號對音頻信號編碼”之申請的分案申請。?
技術(shù)領(lǐng)域
本發(fā)明涉及音頻編碼和解碼,并且具體地針對具有諧波或語音內(nèi)容的、可受到時間扭曲處理的音頻信號的編碼/解碼。?
背景技術(shù)
在下文中,將給出對時間扭曲音頻編碼的領(lǐng)域的簡要說明,該編碼的概念可結(jié)合本發(fā)明的一些實施例一起應(yīng)用。?
近年來,技術(shù)上的發(fā)展可將音頻信號變換為頻域表示,并且例如考慮到感知屏蔽閾值,可以對該頻域表示進(jìn)行有效地編碼。如果發(fā)送編碼頻譜系數(shù)組的塊長度很長,且如果僅相當(dāng)小數(shù)目的頻譜系數(shù)遠(yuǎn)在該全局屏蔽閾值之上,同時很大數(shù)目的頻譜系數(shù)在該全局屏蔽閾值附近或之下并可能因而被忽略(或以最小碼長進(jìn)行編碼)時,該音頻信號編碼的概念特別有效。?
例如,基于余弦或基于正弦的調(diào)制的重疊變換通常由于它們的能量壓縮性質(zhì)而用于源編碼的應(yīng)用。即,對于具有恒定基本頻率(音調(diào))的諧音而言,它們將信號能量濃縮于小數(shù)目的頻譜分量(子頻帶)中,這導(dǎo)致了有效的信號表示。?
大體而言,應(yīng)當(dāng)將信號的(基本)音調(diào)理解為可與該信號頻譜相區(qū)別的最低主頻率。在普通語音模型中,該音調(diào)是由人類喉嚨調(diào)制的激勵信號的頻率。如果僅一個單一基本頻率存在,該頻譜將極其簡單,僅包括該基本頻率及泛音。可以高效地對這種頻譜編碼。然而,對于?具有變化音調(diào)的信號,對應(yīng)于每個諧波分量的能量散布于若干變換系數(shù)上,因而導(dǎo)致編碼效率的減少。?
為了克服編碼效率的減少,在不均勻時間網(wǎng)格上對要編碼的音頻信號有效地重新采樣。在隨后的處理中,對通過不均勻重新采樣所獲得的采樣位置就好像它們表示均勻時間網(wǎng)格上的值一樣進(jìn)行處理。該操作一般由短語“時間扭曲”來表示。可取決于該音調(diào)的時間變化來有利地選擇采樣時間,使得該音頻信號的時間扭曲版本中的音調(diào)變化小于該音頻信號的原始版本(時間扭曲前)中的音調(diào)變化。該音調(diào)變化也可用短語“時間扭曲輪廓”表示。在音頻信號的時間扭曲之后,將該音頻信號的時間扭曲版本轉(zhuǎn)換為頻域。該依賴于音調(diào)的時間扭曲具有如下效果:時間扭曲音頻信號的頻域表示一般地顯示出將能量壓縮成遠(yuǎn)遠(yuǎn)小于該原始音頻信號(未被時間扭曲)的頻域表示的頻譜分量數(shù)目。?
在解碼器側(cè),將該時間扭曲音頻信號的頻域表示轉(zhuǎn)換回時域,使得該時間扭曲音頻信號的時域表示在解碼器側(cè)可用。然而,在解碼器側(cè)重建時間扭曲音頻信號的時域表示中,不包括該編碼器側(cè)輸入音頻信號的原始音調(diào)變化。因此,通過對時間扭曲音頻信號的解碼器側(cè)重建時域表示進(jìn)行重新采樣,來應(yīng)用另一時間扭曲。為了在解碼器處獲得對編碼器側(cè)輸入音頻信號的良好重建,需要解碼器側(cè)時間扭曲至少近似編碼器側(cè)時間扭曲的反操作。為了獲得恰當(dāng)?shù)臅r間扭曲,需要讓允許調(diào)整解碼器側(cè)時間扭曲的信息在解碼器處可用。?
因為一般要求將這種信息從音頻信號編碼器傳輸至音頻信號解碼器,需要將該發(fā)送所需的比特率保持為小,同時仍允許在解碼器側(cè)可靠重建所需的時間扭曲信息。?
鑒于上述討論,需要創(chuàng)建一種概念,其允許有效應(yīng)用音頻編碼器中時間扭曲概念的比特率。?
發(fā)明內(nèi)容
本發(fā)明的目的是創(chuàng)建以下概念:基于在時間扭曲音頻信號編碼器或時間扭曲音頻信號解碼器中可用的信息,來增強由編碼音頻信號所?提供的聽覺印象。?
由根據(jù)權(quán)利要求1所述的用于基于音頻信號的表示來提供時間扭曲激活信號的時間扭曲激活信號提供器、根據(jù)權(quán)利要求12所述的用于對輸入音頻信號編碼的音頻信號編碼器、根據(jù)權(quán)利要求14所述的用于提供時間扭曲激活信號的方法、根據(jù)權(quán)利要求15所述的用于提供輸入音頻信號的編碼表示的方法、或根據(jù)權(quán)利要求16所述的計算機程序來達(dá)成該目的。?
本發(fā)明的另一目的是提供一種增強的音頻編碼/解碼方案,該方案提供較高的質(zhì)量或較低的比特率。?
由根據(jù)權(quán)利要求17、26、32、37所述的音頻編碼器、根據(jù)權(quán)利要求20所述的音頻解碼器、根據(jù)權(quán)利要求23、30、35或37所述的音頻編碼方法、根據(jù)權(quán)利要求24所述的解碼方法、或根據(jù)權(quán)利要求25、31、36或43所述的計算機程序來達(dá)成該目的。?
根據(jù)本發(fā)明的實施例與用于時間扭曲MDCT變換編碼器的方法相關(guān)。一些實施例僅與編碼器工具相關(guān)。然而,其它實施例還與解碼器工具相關(guān)。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會,未經(jīng)弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210491312.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息提供系統(tǒng)、信息提供方法、信息提供設(shè)備
- 信息提供裝置、信息提供系統(tǒng)
- 游戲提供系統(tǒng)、游戲提供程序和游戲提供方法
- 游戲提供系統(tǒng)、游戲提供程序和游戲提供方法
- 信息提供方法、信息提供裝置、信息提供系統(tǒng)及信息提供程序
- 動作信息提供裝置、提供系統(tǒng)以及提供方法
- 提供裝置、提供方法、提供系統(tǒng)以及存儲介質(zhì)
- 提供裝置、提供方法、存儲介質(zhì)以及提供系統(tǒng)
- 提供裝置、提供方法、存儲介質(zhì)以及提供系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法以及內(nèi)容提供系統(tǒng)





