[發明專利]用于編碼和解碼音頻信號的方法和裝置有效
| 申請號: | 201480032227.2 | 申請日: | 2014-05-27 |
| 公開(公告)號: | CN105264595B | 公開(公告)日: | 2019-10-01 |
| 發明(設計)人: | 彼得·加克斯;亞歷山大·庫魯格爾 | 申請(專利權)人: | 杜比國際公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/24 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 張勁松 |
| 地址: | 荷蘭阿*** | 國省代碼: | 荷蘭;NL |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 環繞 立體聲 立體聲信號 音頻比特流 維度降低 殘差 分層 方法和裝置 解碼 殘差信號 多路復用 分層編碼 結構信息 輸出信號 信號執行 信號渲染 音頻信號 比特流 基礎層 新概念 重建 | ||
本發明介紹了對HOA內容進行分層編碼的新概念。用于編碼分層音頻比特流的方法包括:將HOA輸入信號渲染為環繞立體聲,編碼環繞立體聲以用于基礎層輸出信號,解碼經編碼的環繞立體聲以獲得經重建的環繞立體聲信號,對所接收的HOA輸入信號執行維度降低,計算經維度降低的HOA信號和經重建的環繞立體聲信號之間的殘差,編碼該殘差信號,以及將關于HOA輸入信號的結構信息、經編碼的殘差和經編碼的環繞立體聲多路復用為比特流以獲得分層音頻比特流。
技術領域
本發明涉及用于編碼音頻信號的方法、用于編碼音頻信號的裝置、用于解碼音頻信號的方法和用于解碼音頻信號的裝置。
背景技術
對高階高保真度立體聲響復制(Higher-Order Ambisonics,HOA)內容的壓縮尚未在科學文獻中被深入地研究。因此,本節內容將介紹用于HOA內容的自包含壓縮的示例性當前技術的整體架構。通過廣泛的測試已經驗證了此架構使能以中級(例如,256kbit/s)到高級(例如,1.5Mbit/s)數據速率對高分辨率空間聲音場景的高質量編碼。本節所提供的背景信息對于理解在此架構上建立的分層概念來說是必要的。
圖1從編碼器的角度示出了自包含HOA壓縮的概念。應當注意的是圖中所提供的數字和參數是示例性的。例如,這里所示出的編解碼器架構用于編碼4階HOA內容(N=4),其需要(N+1)2=25個等效的音頻通道來進行全3D表現。相同的概念可被用于從N=1向上的任何HOA階數的編碼。同樣地,在維度降低之后所提取的“音頻通道”的數字8是應當突出數量級的示例性數字——然而,當編碼階數為N=4的HOA內容時,已經發現此數字8(平均來說)是適當的。
編碼過程被分為兩個級,這兩個級在一定程度上彼此獨立。第一級10是維度降低級。維度降低級10分析輸入HOA內容,并且通過將信號重組為更低數量的主導聲音組分來降低信號維度。有點抽象的術語“聲音組分”之所以被使用是因為所產生的信號不一定對應于聲音對象、特定的空間方向或環繞感(ambience)——盡管在特殊情況下它們實際上也可以這樣對應。
從信息論可知,至少對于復雜音頻場景來說,在此級10的輸出處所提供的信息系統地少于輸入信息。維度降低級10以這樣的方式操作:(1)通過盡可能多地利用輸入音頻場景的固有冗余使信息丟失被最小化,以及(2)不相干度被降低,即輸出信號仍攜帶足夠的信息從而經重建的音頻場景與輸入內容相比的感知差異被最小化。此級10采用時變和信號自適應的信號處理。取決于參數化和信號特征,其輸出信號的數量也可以是自適應的。
第二編碼級11包括針對單聲道音頻信號的若干并行感知編碼器(在此例中為8個)組成的組。這些編碼器使用時頻編碼的原理來操作和編碼獨立的主導聲音組分,時頻編碼原理自1990年代已經被很好地建立起來。例如,MPEG-4高級音頻編碼(AAC)編碼器組可在第二編碼級11被使用。編碼器實施方式需要被稍加修改以使全局代碼器控制塊能夠影響這些核心編解碼器的某些參數,諸如,平均比特率、窗口切換行為、比特池大小、頻帶復制行為等等。這種架構已經被選擇,因為其通過在可能的最大程度上促進對現有編解碼器實施方式和相應的優化方式的重復使用來將實施HOA編解碼器所需的設計工作減少到最低限度。
整個解碼器的操作由代碼器控制級12控制。這里執行了確定驅動和控制其他信號處理級所需的參數的感知音頻場景分析。具體來說,這種控制實例負責數據速率資源的全局優化,并且對于實現強大的總體率失真性能是非常重要的。最后,第二編碼級11的結果比特流和來自代碼器控制級12的邊信息(side information)被多路復用13至單個輸出比特流中。
發明內容
所期望的是通過允許與其他/環繞立體聲格式的至少基本的兼容性的方式來編碼HOA。圖1所示的架構的一個問題在于其僅適用于HOA格式的信號。本發明介紹了用于對HOA內容進行分層編碼的新的概念、方法和裝置,其產生了可向后兼容的環繞立體聲格式的比特流。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比國際公司,未經杜比國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480032227.2/2.html,轉載請聲明來源鉆瓜專利網。





