[發明專利]解碼具有增強的頻譜帶復制元數據的音頻位流有效
| 申請號: | 201811521577.1 | 申請日: | 2016-03-10 |
| 公開(公告)號: | CN109326295B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | L·維爾莫斯;H·普恩哈根;P·埃斯特蘭德 | 申請(專利權)人: | 杜比國際公司 |
| 主分類號: | G10L19/16 | 分類號: | G10L19/16;G10L19/035;G10L19/24;G10L21/038 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 宋巖 |
| 地址: | 荷蘭阿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 解碼 具有 增強 頻譜 復制 數據 音頻 | ||
公開了解碼具有增強的頻譜帶復制元數據的音頻位流。實施例涉及一種音頻處理單元,包括緩沖器、位流有效載荷去格式化器和解碼子系統。緩沖器存儲編碼音頻位流的至少一個塊。塊包括以標識符開始、后面跟著填充數據的填充元素。填充數據包括識別是否對塊的音頻內容執行增強的頻譜帶復制(eSBR)處理的至少一個標志。還提供了用于對編碼音頻位流進行解碼的對應方法。
本申請是申請號為201680015399.8,申請日為2016年3月10日,題為“解碼在至少一個填充元素中具有增強的頻譜帶復制元數據的音頻位流”的中國發明專利申請的分案申請。
技術領域
本發明涉及音頻信號處理。一些實施例涉及包括用于控制增強的頻譜帶復制(eSBR)的元數據的音頻位流(例如,具有MPEG-4AAC格式的位流)的編碼和解碼。其它實施例涉及通過不被配置為執行eSBR處理并且忽略這種元數據的傳統解碼器對這種位流進行解碼,或者通過響應于位流生成eSBR控制數據來對不包括這種元數據的音頻位流進行解碼。
背景技術
典型的音頻位流包括指示音頻內容的一個或多個聲道(channel)的音頻數據(例如,編碼的音頻數據)以及指示音頻數據或音頻內容的至少一個特性的元數據兩者。用于生成編碼音頻位流的一種眾所周知的格式是在MPEG標準ISO/IEC?14496-3:2009中描述的MPEG-4高級音頻編碼(AAC)格式。在MPEG-4標準中,AAC表示“高級音頻編碼”,而HE-AAC表示“高效高級音頻編碼”。
MPEG-4?AAC標準定義了幾個音頻規范(profile),這幾個音頻規范確定在適用的(complaint)編碼器或解碼器中存在哪些對象和編碼工具。這些音頻規范中的三個是(1)AAC規范,(2)HE-AAC規范,和(3)HE-AAC?v2規范。AAC規范包括AAC低復雜度(或“AAC-LC”)對象類型。AAC-LC對象是MPEG-2AAC低復雜度規范的對應物,有一些調整,并且既不包括頻譜帶復制(“SBR”)對象類型也不包括參數化立體聲(“PS”)對象類型。HE-AAC規范是AAC規范的超集(superset)并且還包括SBR對象類型。HE-AAC?v2規范是HE-AAC規范的超集,并且還包括PS對象類型。
SBR對象類型包含頻譜帶復制工具,這是重要的編碼工具,該編碼工具顯著提高感知音頻編解碼器的壓縮效率。SBR在接收器側(例如,在解碼器中)重建音頻信號的高頻分量。因此,編碼器只需要編碼和發送低頻分量,從而允許在低數據速率下的、高得多的音頻質量。根據從編碼器獲得的控制數據和可用的帶寬受限信號,SBR基于先前被截短以便減小數據速率的諧波序列的復制。音調與類噪聲(noise-like)分量之間的比通過自適應逆濾波以及噪聲和正弦波的可選添加來維持。在MPEG-4?AAC標準中,SBR工具執行頻譜修補,其中將數個鄰接的正交鏡像濾波器(QMF)子帶從音頻信號的所發送低頻帶部分復制到在解碼器中生成的音頻信號的高頻帶部分。
對于某些音頻類型,諸如具有相對低交叉頻率的音樂內容,頻譜修補可能不是理想的。因此,需要改進頻譜帶復制的技術。
發明內容
第一類實施例涉及包括存儲器、位流有效載荷去格式化器和解碼子系統的音頻處理單元。存儲器被配置為存儲編碼音頻位流(例如,MPEG-4?AAC位流)的至少一個塊。位流有效載荷去格式化器被配置為對編碼音頻塊進行解復用。解碼子系統被配置為對編碼音頻塊的音頻內容進行解碼。編碼音頻塊包括具有指示填充元素的開始的標識符以及標識符之后的填充數據的填充元素。填充數據包括識別是否要對編碼音頻塊的音頻內容執行增強的頻譜帶復制(eSBR)處理的至少一個標志。
第二類實施例涉及用于對編碼音頻位流進行解碼的方法。該方法包括接收編碼音頻位流的至少一個塊、對編碼音頻位流的至少一個塊的至少一些部分進行解復用,以及對編碼音頻位流的至少一個塊的至少一些部分進行解碼。編碼音頻位流的至少一個塊包括具有指示填充元素的開始的標識符以及標識符之后的填充數據的填充元素。填充數據包括識別是否要對編碼音頻位流的至少一個音頻塊的音頻內容執行增強的頻譜帶復制(eSBR)處理的至少一個標志。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比國際公司,未經杜比國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811521577.1/2.html,轉載請聲明來源鉆瓜專利網。





