[發明專利]使用自適應混合變換的多聲道音頻編碼比特流的解碼有效
| 申請號: | 201410410643.3 | 申請日: | 2010-10-28 |
| 公開(公告)號: | CN104217724A | 公開(公告)日: | 2014-12-17 |
| 發明(設計)人: | K·拉馬莫爾西 | 申請(專利權)人: | 杜比實驗室特許公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/02 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 歐陽帆 |
| 地址: | 美國加*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 自適應 混合 變換 多聲道 音頻 編碼 比特流 解碼 | ||
本分案申請是基于申請號為201080051553.X(國際申請號為PCT/US2010/054480),申請日為2010年10月28日,發明名稱為“使用自適應混合變換的多聲道音頻編碼比特流的解碼”的中國專利申請的分案申請。
相關申請的交叉引用
本申請案請求2009年12月7日提交的第61/267,422號美國臨時專利申請案的優先權,所述申請案的全部內容以引用的方式并入本文。
技術領域
本發明通常涉及音頻編碼系統,且更具體來說涉及對已編碼的數字音頻信號進行解碼的方法和裝置。
背景技術
由團體合作聯合委員會(JCIC)的成員組織成立的美國先進電視系統委員會(ATSC)公司開發出用于美國本地電視服務發展的一套協調一致的國家標準。包括有關音頻編碼/解碼標準的這些標準在多個文件中進行陳述,所述多個文件包括2005年6月14日出版的名稱為“Digital?Audio?Compression?Standard(AC-3,E-AC-3)”的文件A/52B(修訂版B),其全部內容以引用的方式并入本文。文件A/52B中指定的音頻編碼算法稱為“AC-3”。描述在所述文件的附件E中的此算法的一加強版稱為“E-AC-3”。這兩個算法在本文中稱為“AC-3”,且有關標準在本文中稱為“ATSC標準”。
所述A/52B文件并未指定算法設計的很多方面,而是描述了“比特流語法”,其定義了兼容解碼器一定能夠解碼的編碼信息的結構與語法特征。符合所述ATSC標準的很多應用將編碼數字音頻信息作為二進制數據以串行方式發送。結果,所述編碼數據通常指的是比特流,但其它數據安排也是允許的。為了便于論述,術語“比特流”在本文中用來指編碼數字音頻信號,而與采用何種格式、記錄或傳輸技術無關。
符合所述ATSC標準的比特流以一連串“同步幀”的形式排列。每一幀是比特流的一個單元,其能夠被完全解碼成脈沖編碼調制(PCM)的數字音頻數據的一個或更多個聲道。每一幀包括“音頻塊”和與所述音頻塊相關的幀元數據。所述音頻塊各包含表示一個或更多個音頻聲道的數字音頻樣本的編碼音頻數據和與所述編碼音頻數據相關的塊元數據。
盡管算法設計的細節在所述ATSC標準中未被指定,但是某些算法特征已被專業解碼裝置與消費解碼裝置的制造商廣泛采用。可以解碼由E-AC-3編碼器產生的增強型AC-3比特流的解碼器的實施方式的一個普遍特征在于如下的算法,所述算法在解碼另一聲道的數據之前解碼一幀中針對相應聲道的所有編碼數據。此方法已經用來提高具有很小芯片上存儲器的單芯片處理器的實施性能,這是因為一些解碼過程需要從一幀中的多個音頻塊中的每一塊得到指定聲道的數據。通過以聲道順序處理編碼數據,解碼操作可以利用針對特定聲道的芯片上存儲器來執行。解碼后的聲道數據可以隨后轉移到芯片外存儲器來為下一個聲道空出芯片上資源。
符合所述ATSC標準的比特流可以非常復雜,因為可能有大量變化。本文只簡略提及的一些示例包括對于標準AC-3比特流、多個獨立流、依賴的子流的聲道耦合、聲道重新矩陣化、對白歸一化(dialog?normalization)、動態范圍壓縮、聲道向下混合與塊長度轉換以及對于增強型AC-3比特流的頻譜擴展和自適應混合變換。這些特征的細節可以從所述A/52B文件獲得。
通過獨立處理每一聲道,這些變化所需的算法能夠得以簡化。可以不考慮這些變化來執行如合成過濾之類的隨后的復雜處理。較簡單的算法似乎提供了如下優勢:減少處理一個音頻數據幀所需的計算資源。
遺憾的是,此方法要求解碼算法讀取和檢查所有音頻塊中的數據兩次。讀取和檢查一幀中的音頻塊數據的每次重復在本文中稱為一次“通過(pass)”所述音頻塊。第一次通過執行大量計算以確定每一塊中的編碼音頻數據的位置。當第二次通過執行解碼過程時,其執行很多與所述第一次通過執行的這些計算相同的計算。兩次通過都需要相當多的計算資源來計算數據位置。如果最初的通過可以被消除,那么可以減少解碼一個音頻數據幀所需的總處理資源。
發明內容
本發明的一個目的在于減少解碼以諸如上面所提及的幀與音頻塊的分層單元排列的編碼比特流中的一個音頻數據幀所需的計算資源。以上文字和以下公開指的是符合所述ATSC標準的編碼比特流,但是本發明并不局限于僅在這些比特流的情況下使用。本發明的原理基本上可以應用于具有類似于在AC-3編碼算法中使用的幀、塊和聲道的結構特征的任何編碼比特流。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比實驗室特許公司,未經杜比實驗室特許公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410410643.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:帶有冷卻裝置的乳化機
- 下一篇:一種實時語音樣本檢測方法及系統





