[發(fā)明專利]音頻解碼器裝置及音頻編碼器裝置有效
| 申請?zhí)枺?/td> | 201580044544.0 | 申請日: | 2015-08-14 |
| 公開(公告)號: | CN106663443B | 公開(公告)日: | 2021-06-29 |
| 發(fā)明(設(shè)計)人: | 斯蒂芬·多拉;吉約姆·福克斯;伯恩哈特·格里爾;馬庫斯·繆特拉斯;格萊澤格爾茲·皮耶奇克;伊曼紐爾·拉維利;馬庫斯·施奈爾 | 申請(專利權(quán))人: | 弗勞恩霍夫應(yīng)用研究促進協(xié)會 |
| 主分類號: | G10L19/24 | 分類號: | G10L19/24;G10L19/04;G10L19/16;G10L19/22;G10L19/20;G10L19/18;G10L19/26;G10L19/00 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋融冰 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 解碼器 裝置 編碼器 | ||
用于對比特流進行解碼的音頻解碼器裝置,所述音頻解碼器裝置包括:預(yù)測性解碼器,用于從比特流產(chǎn)生解碼的音頻幀,其中預(yù)測性解碼器包括用于從比特流產(chǎn)生用于解碼的音頻幀的一個或多個音頻參數(shù)的參數(shù)解碼器,以及其中預(yù)測性解碼器包括用于通過合成用于解碼的音頻幀的一個或多個音頻參數(shù)而產(chǎn)生解碼的音頻幀的合成濾波器裝置;存儲器裝置,包括一個或多個存儲器,其中每個存儲器用于存儲用于解碼的音頻幀的存儲器狀態(tài),其中一個或多個存儲器的用于解碼的音頻幀的存儲器狀態(tài)被合成濾波器裝置用來合成用于解碼的音頻幀的一個或多個音頻參數(shù);以及存儲器狀態(tài)再取樣裝置,用于通過針對所述存儲器中的一個或多個再取樣用來合成用于先前解碼的音頻幀的一個或多個音頻參數(shù)的先前存儲器狀態(tài),為所述存儲器中的一個或多個確定用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài),解碼的音頻幀具有取樣率,先前解碼的音頻幀具有與解碼的音頻幀的取樣率不同的先前取樣率,并用于將用于所述存儲器中的一個或多個的用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài)存儲于各個存儲器中。
技術(shù)領(lǐng)域
本發(fā)明涉及語音及音頻編碼,尤其涉及用于處理音頻信號(對于其,輸入和輸出取樣率從先前幀變化至當(dāng)前幀)的音頻編碼裝置以及音頻解碼裝置。本發(fā)明還涉及操作此類裝置的方法以及執(zhí)行此方法的計算機程序。
背景技術(shù)
語音及音頻編碼能夠得到具有多節(jié)奏(multi-cadence)的輸入及輸出的好處,并且得到能夠立即地且無縫地將一個取樣率切換至另一取樣率。傳統(tǒng)的語音及音頻編碼器對于確定的輸出比特率使用單取樣率并且在不徹底重設(shè)系統(tǒng)時無法對其進行改變。這隨后在通信中以及在解碼信號中造成不連續(xù)。
另一方面,通過選擇通常取決于源和信道條件的多個優(yōu)化參數(shù),適應(yīng)性取樣率以及比特率允許較高質(zhì)量。隨后,重要的是當(dāng)改變輸入/輸出信號的取樣率時實現(xiàn)無縫過渡。
此外,重要的是對于此過渡限制復(fù)雜度增加。現(xiàn)代語音及音頻編解碼器,如將至的跨LTE網(wǎng)絡(luò)的3GPP EVS,將需要能夠開發(fā)此功能。
高效的語音及音頻編碼器需要能夠從時域至另一者改變其取樣率以更好地適合于源與信道條件。取樣率的改變對于連續(xù)線性濾波器尤其是個問題,其僅可以在它們的過去狀態(tài)顯示與當(dāng)前時間區(qū)間相同的取樣率用以濾波時應(yīng)用。
更特別地,預(yù)測性編碼隨著時間和幀在編碼器及解碼器處維持不同的存儲器狀態(tài)。在碼激勵線性預(yù)測(CELP,code-excited linear prediction)中,這些存儲器通常是線性預(yù)測編碼(LPC)合成濾波器存儲器、去加重濾波器存儲器以及適應(yīng)性碼本。直接的方案是當(dāng)取樣率改變發(fā)生時重設(shè)全部存儲器。這在解碼信號中造成非常惱人的不連續(xù)。恢復(fù)可能是非常久且非常明顯的。
圖1示出根據(jù)現(xiàn)有技術(shù)的第一音頻解碼器裝置。使用此音頻解碼器裝置,當(dāng)來源于非預(yù)測性編碼方案時,無縫地切換至預(yù)測性編碼是可能的。此可以通過對用于維持預(yù)測性編碼器所需的濾波器狀態(tài)的非預(yù)測性編碼器的解碼輸出的反向濾波來進行。例如,在AMR-WB+及USAC中進行,用于從基于變換的編碼器、TCX切換至語音編碼器、ACELP。然而,在此兩種編碼器中,取樣率是相同的。反向濾波可直接用在TCX的解碼的音頻信號上。此外,在USAC及AMR-WB+中的TCX傳送并利用也被反向濾波所需的LPC系數(shù)。LPC解碼的系數(shù)在反向濾波計算中被簡單地再使用。值得注意的是,如果使用相同的濾波器和相同的取樣率在兩個預(yù)測性編碼器之間切換,則不需要反向濾波。
圖2示出根據(jù)現(xiàn)有技術(shù)的第二音頻解碼器裝置。在兩個編碼器具有不同取樣率的情況下,或在相同的預(yù)測性編碼器中但使用不同取樣率切換的情況下,如圖1所示的先前音頻幀的反向濾波不再足夠。直接的方案是將過去解碼的輸出再取樣為新的取樣率并且然后通過反向濾波計算存儲器狀態(tài)。如果一些濾波器系數(shù)是取樣率依賴的,如針對LPC合成濾波器的情況,則需要進行再取樣的過去信號的額外分析。為了以新的取樣率fs_2得到LPC系數(shù),重新計算自相關(guān)函數(shù)且對再取樣的過去解碼的樣本使用列文遜-杜賓算法(Levinson-Durbin algorithm)。此方案是計算苛刻的并且難以在實際實施中使用。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于弗勞恩霍夫應(yīng)用研究促進協(xié)會,未經(jīng)弗勞恩霍夫應(yīng)用研究促進協(xié)會許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580044544.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





