[發明專利]一種空間參數立體聲編解碼方法及其裝置無效

申請號：	200710053770.2	申請日：	2007-11-06
公開（公告）號：	CN101162904A	公開（公告）日：	2008-04-16
發明（設計）人：	胡瑞敏;陳水仙;艾浩軍;涂衛平;曹晟;王恒;李璇;周婷	申請（專利權）人：	武漢大學
主分類號：	H03M7/30	分類號：	H03M7/30;H04S3/00
代理公司：	武漢天力專利事務所	代理人：	馮衛平;程祥
地址：	43007***	國省代碼：	湖北;42
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種空間參數立體聲解碼方法及其裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明屬于數字音頻壓縮編碼領域，特別涉及一種以參數表示空間信息的立體聲編解碼系統和裝置。

背景技術

數字音頻編碼起源于20世紀80年代末，以MP3(MPEG-1?Layer?III)和AAC(Advanced?Audio?Coding)為典型代表。此時編碼技術在立體聲的處理方面考慮聲道間的相關性，采用和差(Mid/Side)立體聲或強度立體聲(Intensity?Stereo)處理技術，然后對處理后的兩路完整的音頻信號采用獨立的編碼方法，因此碼率與聲道數基本成正比。

2002年C.Faller等人提出了一種基于空間心理聲學的參數立體聲編解碼系統BCC(Binaural?Cue?Coding)。此系統在變換域提取聲道間強度差ILD(Interchannel?Level?Difference)，聲道間時間差ITD(Interchannel?Time?Difference)，和聲道間相關度IC(Interchannel?Coherence)，其解碼器根據這些參數和下混聲道重建多聲道的輸出。2004年J.Breebaart等人提出參數立體聲PS(Parametric?Stereo)編解碼系統，2005年MPEG推出MPEG環繞聲(MPEG?Surround)系統都是以BCC為基礎發展起來的立體聲/多聲道編解碼系統，其核心架構與BCC系統一致。

上述空間參數編解碼系統相對于只采用和差立體聲和強度立體聲技術的MP3/AAC等編解碼系統，在性能上有明顯的提升：以單聲道的碼率達到立體聲的音質，因此在對音質和碼流要求嚴格的音頻廣播和移動音頻中得到應用。但是這些空間參數編解碼系統最突出的問題是延時增加，編解碼端的時頻分析模塊引入了至少一幀的延時，通常在20ms到40ms之間，不利于雙向實時通信。因此減小空間參數立體聲編解碼的延時是本領域亟待解決的問題。

BCC、PS、和MPEG?Surround的另一個問題是難于實現動態的時頻劃分。根據空間心理聲學，ILD、ITD、和IC只有針對同一或空間上連續的聲源才有明確的意義。上述空間參數編碼系統都采用子帶劃分的方式來區分信號中不同的聲源進而提取空間參數，為了避免傳送子帶劃分信息帶來的碼率增加，這種劃分是靜態的且獨立于信號特性的。由于實際信號中各個聲源的頻譜范圍是動態的，這種方式降低了空間參數編碼的效率。因此在不增加碼率的情況下實現動態的時頻劃分是本領域亟待解決的另一個問題。

發明內容

本發明的目的在于解決現有空間參數編解碼系統的不足，提供一種無附加延時且支持動態時頻劃分的空間參數立體聲編解碼方法及其裝置，減少系統延時并提高立體聲信號壓縮的效率。

本發明的編碼技術解決方案包括以下步驟：

步驟1，對輸入的左右兩路時域音頻信號進行下混，生成一路信號；

步驟2，對得到的下混信號進行變換音頻編碼，生成下混信號的編碼數據；

步驟3，獲得與下混信號的編碼數據對應的下混信號的反量化頻譜；

步驟4，分析頻域反量化的下混信號，將頻譜劃分成若干連續且無重疊的子帶；

步驟5，以劃分的子帶為單位，提取輸入的左右兩路信號在頻域每個子帶的空間參數信息，生成空間參數編碼數據；

步驟6，將下混信號的編碼數據和空間參數編碼數據按一定格式組合成一路編碼碼流。

而且，步驟1所述的下混是在時域操作，即取左右兩路音頻信號的時域平均值作為下混信號，其中時域平均值是兩路信號在同一時刻處的樣點值之和的一半。

而且，步驟1所述的下混是在頻域操作，即取左右兩路音頻信號的頻域平均值或乘以增益系數，得到頻域下混信號，其中頻域平均值是兩路信號在同一頻點處的譜線值之和的一半，增益系數是為了調整下混信號能量而在平均值之上乘的一個正的實數。

而且，步驟3所述的下混信號的反量化頻譜，通過對下混信號的編碼數據進行解碼獲得；或者當變換編碼過程中生成了下混信號的反量化頻譜時，直接從編碼過程中獲得。