[發明專利]頻譜包絡的樣本值的基于上下文的熵編碼、解碼的裝置及方法有效
| 申請號: | 201480041809.7 | 申請日: | 2014-07-15 |
| 公開(公告)號: | CN105556599B | 公開(公告)日: | 2019-12-10 |
| 發明(設計)人: | 弗洛林·基多;安德烈·尼德邁爾 | 申請(專利權)人: | 弗朗霍夫應用科學研究促進協會 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L19/032;G10L21/038;G10L19/038 |
| 代理公司: | 11201 北京清亦華知識產權代理事務所(普通合伙) | 代理人: | 宋融冰 |
| 地址: | 德國*** | 國省代碼: | 德國;DE |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 頻譜 包絡 樣本 基于 上下文 編碼 | ||
通過結合一方面的頻譜時間預測與另一方面的對殘差進行基于上下文的熵編碼,而特別地根據對當前樣本值的頻譜時間鄰近區域中的頻譜包絡的成對的已編碼/解碼的樣本值之間的偏差的測量,確定用于當前樣本值的上下文,獲得用于對頻譜包絡的樣本值進行編碼的改進概念。一方面的頻譜時間預測與另一方面的隨著根據偏差測量的上下文的選擇來對預測殘差進行基于上下文的熵編碼的結合與頻譜包絡的本質相協調。
技術領域
本申請涉及頻譜包絡的樣本值的基于上下文的熵編碼及其在音頻編碼/壓縮中的使用。
背景技術
如在[1]和[2]中所述的許多現有技術的有損(lossy)音頻編碼器,基于MDCT變換,并使用不相關性減小和冗余度減小,以對于給定的感知品質最小化所需的比特率。為了減小表示精確度或移除非感知相關的頻率信息,不相關性減小通常利用人類聽覺系統的感知限制。為了實現剩余數據的最簡潔的表示,通常使用結合熵編碼的統計建模,應用冗余度減少以利用統計結構或相關性。
除了別的之外,參數化編碼概念用于高效地對音頻內容進行編碼。使用參數化編碼,使用參數而非使用實際時域音頻樣本或類似來描述音頻信號的部分,如其頻譜圖的部分。例如,音頻信號的頻譜圖的部分可在解碼器側與僅包括參數(如頻譜包絡和可選的其他控制合成的參數)的數據流合成,以使合成的頻譜圖部分適于所傳輸的頻譜包絡。此種的新技術為頻譜頻帶復制(SBR),根據此,核心編解碼器用于編碼并傳輸音頻信號的低頻分量,然而所傳輸的頻譜包絡用在解碼側,以頻譜地成形/形成音頻信號的低頻帶分量的重建的頻譜復制,從而在解碼側合成音頻信號的高頻帶分量。
以上所述的編碼技術的架構內的頻譜包絡,在數據流內以某種合適的頻譜時間分辨率傳輸。在某種程度上類似于頻譜包絡樣本值的傳輸,用于縮放頻譜線系數或頻域系數(如 MDCT系數)的比例因子,同樣地以合適的頻譜時間分辨率傳輸,該合適的頻譜時間分辨率比原始的頻譜線分辨率更粗糙,例如在頻譜意義上。
為了傳遞描述頻譜包絡或比例因子或頻域系數的樣本的信息,可使用固定的哈夫曼 (Huffman)編碼表。改進的方法使用上下文編碼,如在[2]和[3]中所述,其中用于選擇概率分布以用于對值進行編碼的上下文跨時間與頻率延伸。個別的頻譜線(如MDCT系數值)為復頻譜線的實數投射,且其可能在本質上顯現某些隨機性,即便復頻譜線的振幅為跨時間恒定的,但相位因幀而異。為了有如[3]所描述的良好結果,這需要上下文選擇、量化以及映射的相當復雜的機制。
在圖像編碼中,所使用的上下文通常為圖像的跨x軸和y軸的二維的,如在[4]中所述。在圖像編碼中,例如利用伽馬(gamma)調節,值處于線性域或冪律域。此外,在每個上下文中,單個固定的線性預測可被用作平面擬合及基本的邊緣檢測機制,而且預測誤差可被編碼。參數化Golomb或Golomb-Rice編碼可用于對預測誤差進行編碼。此外,例如使用基于比特的編碼器,運行長度編碼(run length coding)用于補償對非常低的熵信號(每樣本低于1比特)進行直接編碼的困難度。
然而,盡管有關于比例因子和/或頻譜包絡的編碼的改進,仍需要用于對頻譜包絡的樣本值進行編碼的改進概念。因此,本發明的目的在于提供用于對頻譜包絡的頻譜值進行編碼的概念。
發明內容
通過待決的獨立權利要求的主旨實現本發明的目的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于弗朗霍夫應用科學研究促進協會,未經弗朗霍夫應用科學研究促進協會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480041809.7/2.html,轉載請聲明來源鉆瓜專利網。





