[發明專利]用于選擇第一編碼算法與第二編碼算法中的一個的裝置及方法有效
| 申請號: | 201480019093.0 | 申請日: | 2014-01-28 |
| 公開(公告)號: | CN105229736B | 公開(公告)日: | 2019-07-19 |
| 發明(設計)人: | 埃曼努埃爾·拉維利;斯特凡·多赫拉;紀堯姆·福奇斯;埃萊尼·福托普洛;克里斯蒂安·赫爾姆里希 | 申請(專利權)人: | 弗勞恩霍夫應用研究促進協會 |
| 主分類號: | G10L19/22 | 分類號: | G10L19/22;G10L19/08;G10L19/02 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 梁麗超;陳鵬 |
| 地址: | 德國*** | 國省代碼: | 德國;DE |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 選擇 第一 編碼 算法 第二 中的 一個 裝置 方法 | ||
一種用以選擇具有一第一特性的一第一編碼算法和具有一第二特性的一第二編碼算法中的一個的裝置,該算法用于編碼一音頻信號的一部分,以獲得該音頻信號的該部分的一經編碼版本,該裝置包含一第一估計器,其用于在實際上并不使用該第一編碼算法編碼及解碼該音頻信號的該部分的情況下,估計該音頻信號的該部分的一第一質量測量,該第一質量測量與該第一編碼算法相關聯。提供用于在實際上并不使用該第二編碼算法編碼及解碼該音頻信號的該部分的情況下,估計該音頻信號的該部分的一第二質量測量的一第二估計器,該第二質量測量與該第二編碼算法相關聯。該裝置包含用于基于該第一質量測量與該第二質量測量之間的一比較,選擇該第一編碼算法或該第二編碼算法的一控制器。
技術領域
本發明涉及音頻編碼,更具體地,涉及切換式音頻編碼,其中對于音頻信號的不同部分,使用不同編碼算法產生經編碼信號。
背景技術
已知判定用于音頻信號的不同部分的不同編碼算法的切換式音頻編碼器。大體而言,切換式音頻編碼器提供在兩個不同模式(即,算法,諸如ACELP(代數碼激勵線性預測(Algebraic Code Excited Linear Prediction;ACELP))及TCX(變換編碼激勵(TransformCoded Excitation;TCX)))之間進行切換。
MPEG USAC(MPEG統一語音音頻編碼(Unified Speech Audio Coding;USAC))的LPD模式基于該兩個不同模式ACELP及TCX。ACELP 為語音狀及瞬態狀信號提供較好質量。TCX為音樂狀及噪聲狀信號提供較好質量。編碼器逐幀地決定使用哪種模式。編碼器所作出的決定對于編解碼器質量至關重要。單一的錯誤決定可產生大量偽像,尤其在低比特率的情況下。
用于決定使用哪種模式的最直接方法為封閉回路模式選擇,亦即執行兩種模式的完整編碼/解碼,接著基于音頻信號及經編碼/經解碼音頻信號計算用于兩種模式的選擇準則(例如,區段性SNR),且最后基于選擇準則選擇模式。此方法大體上產生穩定且穩固的決定。然而,其亦要求大量復雜性,因為必須在每一幀處運行兩種模式。
為減少復雜性,替代性方法為開放回路模式選擇。開放回路選擇由并不執行兩種模式的完整編碼/解碼,但代替地使用通過低復雜性所計算的選擇準則而選擇一模式組成。接著,通過最不復雜模式(通常為TCX)的復雜性減去計算選擇準則所需的復雜性而減少最差狀況復雜性。通常節約大量復雜性,此情況使得當編解碼器最差狀況復雜性受到約束時,此種方法是有吸引力的。
AMR-WB+標準(國際標準3GPP TS 26.290 V6.1.0 2004-12中所定義) 包括用于在80ms幀中,在ACELP/TCX20/TCX40/TCX80的所有組合之間決定的開放回路模式選擇。其描述于3GPP TS 26.290的章節5.2.4中。其亦描述于「用于行動、多媒體的較不復雜音頻編碼(Low Complex Audio Encoding for Mobile,Multimedia),VTC 2006,Makinen等人」的會議文件中,及追溯至此會議文件的作者的US7,747,430 B2及US 7,739,120 B2。
US7,747,430 B2揭示基于長期預測參數的分析的開放回路模式選擇。 US 7,739,120 B2揭示基于信號特性的開放回路模式選擇,該信號特性指示音頻信號的各自區段中的音頻內容的類型,其中,若此選擇并不可行,則進一步基于統計評價進行用于各自相鄰區段的選擇。
可以兩個主要步驟描述AMR-WB+的開放回路模式選擇。在第一主要步驟中,對音頻信號進行若干特征計算,諸如能量位準的標準偏差、低頻 /高頻能量比例、總能量、ISP(導抗譜對(immittance spectral pair;ISP))距離、音調滯后及增益、頻譜傾斜。接著,使用簡單的基于臨限分類器,將此等特征用于在ACELP與TCX之間作出選擇。若在第一主要步驟中選擇TCX,則第二主要步驟以封閉回路方式在TCX20/TCX40/TCX80的可能組合之間決定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于弗勞恩霍夫應用研究促進協會,未經弗勞恩霍夫應用研究促進協會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480019093.0/2.html,轉載請聲明來源鉆瓜專利網。





