[發明專利]從變換編碼/解碼過渡到預測編碼/解碼有效
| 申請號: | 201480062220.5 | 申請日: | 2014-11-14 |
| 公開(公告)號: | CN105723457B | 公開(公告)日: | 2019-05-28 |
| 發明(設計)人: | J.福爾;S.拉戈特 | 申請(專利權)人: | 奧蘭治 |
| 主分類號: | G10L19/20 | 分類號: | G10L19/20 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 李芳華 |
| 地址: | 法國*** | 國省代碼: | 法國;FR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 變換 編碼 解碼 過渡 預測 | ||
本發明涉及一種對數字音頻信號進行解碼的方法,該方法包括以下步驟:根據該數字信號的前一個樣本幀的逆變換解碼進行解碼(E602),該幀是根據變換編碼接收并編碼的;根據該數字信號的當前樣本幀的預測解碼進行解碼(E608),該幀是根據預測編碼接收并編碼的。該當前幀的該預測解碼是過渡預測解碼,該過渡預測解碼不使用該前一個幀所產生的任何自適應字典,并且該方法另外包括:將該預測解碼的至少一個狀態重新初始化成預定的默認值的步驟(E606)、將通過該當前幀的預測解碼合成的信號區段與對應于該前一個幀的該解碼的存儲區段的通過逆變換解碼合成的信號區段進行組合的相加重疊步驟(E609)。本發明相關地涉及一種編碼方法,該編碼方法包括將該預測編碼的至少一個狀態重新初始化成預定的默認值。本發明涉及一種實現這些對應的方法的編碼器和解碼器。
技術領域
本發明涉及數字信號編碼領域。
根據本發明的編碼具體被適配成用于傳輸和/或存儲如音頻信號(語音、音樂或其他)的數字音頻信號。
背景技術
本發明借助于交替至少兩種編碼模式并且其算法延遲被適配成用于會話應用(通常≤40ms)的多模技術有利地適用于語音、音樂和混合內容信號的統一編碼。
為了有效地對語音聲音進行編碼,主張CELP(“碼激勵線性預測”)類型或其變體ACELP(“代數碼激勵線性預測”)技術,最近也更多地提出了 CELP編碼的替代方案,如BV16、BV32、iLBC或SILK編碼器。另一方面,主張變換編碼技術以有效地對音樂聲音進行編碼。
線性預測編碼器并且更具體地CELP類型的編碼器是預測編碼器。它們的目標是基于以下元素中的至少某部分對語音產生進行建模:用于對聲道進行建模的短期線性預測、用于在有聲期中對聲帶的振動進行建模的長期預測、以及來源于一般被稱為固定字典的向量量化字典的用于表示不可能通過預測對其進行建模的“新事物”的激勵(白噪聲、代數激勵)。
使用最多的變換編碼器(例如MPEG AAC或ITU-T G.722.1 Annex C編碼器)使用MDCT(“經修改的離散變換”)類型的臨界采樣變換以便在變換域中壓縮信號。“臨界采樣變換”指針對其在變換域中的系數的數量等于所分析的時間樣本的數量的變換。
用于有效地對包含這兩種類型的內容的信號進行編碼的解決方案在于隨著時間過去(一幀一幀地)選擇最佳技術。這種解決方案已經具體地由 3GPP(“第三代合作伙伴計劃”)標準主體通過被稱為AMR WB+(或增強型 AMR-WB)的技術并且最近更多地通過MPEG-HUSAC(“統一語音音頻編碼”)編解碼器而主張。在對算數延遲沒有嚴苛限制的情況下,由AMR-WB+ 和USAC設想的這些應用不是會話式的,但是對應于廣播和存儲服務。
USAC標準是在ISO/IEC文件23003-3:2012,信息技術--MPEG音頻技術--部分3:統一語音和音頻編碼中公布的。
舉例說明,在M.諾伊恩多夫(Neuendorf)等人的文章《針對低比特率統一語音和音頻編碼的新方案-MPEG RM0》,2009年5月7-10日,第126 屆AES會議中描述了被稱為RM0(參考模型0)的USAC編解碼器的初始版本。此編解碼器在至少兩種編碼模式之間交替:
·針對語音類型的信號:使用ACELP技術的LPD(“線性預測域”)模式;
·針對音樂類型的信號:使用MDCT(“經修改的離散變換”)技術的 FD(“頻域”)模式。
在下文回憶ACELP和MDCT編碼的原理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于奧蘭治,未經奧蘭治許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480062220.5/2.html,轉載請聲明來源鉆瓜專利網。





