[發明專利]對編碼音頻信號解碼的解碼器和編碼音頻信號的編碼器在審
| 申請號: | 202110100367.0 | 申請日: | 2016-03-08 |
| 公開(公告)號: | CN112786061A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 克里斯汀·赫姆瑞希;貝恩德·埃德勒 | 申請(專利權)人: | 弗勞恩霍夫應用研究促進協會 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/18;G10L19/02 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 羅松梅 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 編碼 音頻 信號 解碼 解碼器 編碼器 | ||
示出了用于對編碼音頻信號4進行解碼的解碼器2的示意框圖。解碼器包括自適應頻譜時間轉換器6和重疊相加處理器8。自適應頻譜時間轉換器例如通過頻率時間變換將連續的頻譜值塊4’轉換成連續的時間值塊10。此外,自適應頻譜時間轉換器6接收控制信息12,并且響應于控制信息12,在第一組變換核中的變換核與第二組變換核中的變換核之間進行切換,其中第一組變換核包括在核的側面具有不同對稱性的一個或多個變換核,第二組變換核包括在變換核的側面具有相同對稱性的一個或多個變換核。此外,重疊相加處理器8將連續的時間值塊10重疊相加,以獲得可以作為解碼音頻信號的經解碼的音頻值14。
本申請是申請日為2016年3月8日的中國專利申請CN 201680026851.0(“用于對編碼音頻信號進行解碼的解碼器和用于對音頻信號進行編碼的編碼器”)的分案申請。
技術領域
本發明涉及用于對編碼音頻信號進行解碼的解碼器和用于對音頻信號進行編碼的編碼器。
背景技術
實施例示出了用于音頻編碼中的信號自適應變換核切換的方法和裝置。換句話說,本發明涉及音頻編碼,具體地,涉及通過交疊變換(lapped transform)(例如,改進的離散余弦變換(MDCT)[1])的感知音頻編碼。
目前所有的感知音頻編解碼器(包括MP3、Opus(Celt)、HE-AAC系列以及新的MPEG-H 3D音頻和3GPP增強語音服務(EVS)編解碼器)都采用MDCT對一個或多個通道波形進行頻域量化和編碼。該交疊變換的合成版本使用長度M的頻譜spec[]由下式給出:
其中,M=N/2,N是時間窗長度。在加窗之后,通過重疊相加(OLA)過程將時間輸出xi,n與前一個時間輸出xi-1,n進行組合。C可以是大于0或者小于或等于1的常數參數,例如,2/N。
雖然(1)的MDCT對于各種比特率的任意多個通道的高質量音頻編碼是有效的,但是存在編碼質量可能不足的兩種情況。這些情況是例如:
·具有某些基頻的高次諧波信號,其經由MDCT被采樣,使得每個諧波由多于一個MDCT段(bin)表示。這導致頻譜域中的次優能量壓縮,即低編碼增益。
·通道的MDCT段之間具有大約90度相移的立體聲信號,其不能被傳統的基于M/S立體聲的聯合通道編碼所利用。可以例如使用HE-AAC的參數立體聲或MPEG環繞聲來實現涉及通道間相位差(IPD)的編碼的更復雜的立體聲編碼,但是這樣的工具在單獨的濾波器組域中操作,這增加了復雜度。
有幾篇科學論文和文章提到了MDCT或類似MDST的操作,有時也被稱為例如“交疊正交變換(LOT)”、“擴展交疊變換(ELT)”或“調制交疊變換(MLT)”。只有[4]同時提到了幾個不同的交疊變換,但是并沒有克服上述MDCT的缺陷。
因此,需要一種改進的方法。
發明內容
本發明的目的是提供一種用于處理音頻信號的改善構思。該目的通過獨立權利要求的主題來解決。
本發明基于以下發現:變換核的信號自適應改變或替換可以克服當前MDCT編碼的上述問題。根據實施例,本發明通過將MDCT編碼原理一般化為包括三個其他類似變換來解決關于常規變換編碼的上述兩個問題。按照(1)的合成公式,所提出的一般化應被定義為
請注意,1/2常數已被k0常數替代,并且cos(...)函數已被cs(...)函數替代。以信號和上下文自適應的方式選擇k0和cos(...)。
根據實施例,所提出的MDCT編碼范例的修改可以適于針對每幀的瞬時輸入特性,使得例如先前描述的問題或情況得到解決。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于弗勞恩霍夫應用研究促進協會,未經弗勞恩霍夫應用研究促進協會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110100367.0/2.html,轉載請聲明來源鉆瓜專利網。





