[發明專利]音頻編碼器和解碼器有效
| 申請號: | 201480029565.0 | 申請日: | 2014-05-23 |
| 公開(公告)號: | CN105229729B | 公開(公告)日: | 2019-03-19 |
| 發明(設計)人: | L·J·薩米爾森;H·普恩哈根 | 申請(專利權)人: | 杜比國際公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L19/008;G10L19/032 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 歐陽帆 |
| 地址: | 荷蘭阿*** | 國省代碼: | 荷蘭;NL |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 編碼器 解碼器 | ||
本公開提供用于在音頻編碼系統中對參數向量進行編碼和解碼的方法、設備和計算機程序產品。本公開還涉及用于在音頻解碼系統中重構音頻對象的方法和裝置。根據本公開,用取模差分法對非周期量的向量進行代碼化和編碼可以提高編碼效率,并且提供具有更少內存需求的編碼器和解碼器。另外,提供了一種用于對稀疏矩陣進行編碼和解碼的高效方法。
相關申請的交叉引用
本申請要求2013年5月24日提交的美國臨時專利申請No.61/827264的申請日的權益,其內容通過引用并入于此。
技術領域
本公開一般涉及音頻編碼。特別地,它涉及在音頻編碼系統中對參數向量的編碼和解碼。本公開還涉及在音頻解碼系統中重構音頻對象的方法和裝置。
背景技術
在傳統音頻系統中,采用基于聲道的方法。每個聲道例如可以表示一個揚聲器或者一個揚聲器陣列的內容。對于這種系統,可能的編碼方案包括離散多聲道編碼或者諸如MPEG環繞之類的參數編碼。
近來,已經開發出一種新的方法。該方法是基于對象的。在采用基于對象的方法的系統中,三維音頻場景由音頻對象及其相關聯的位置元數據來表示。在音頻信號的回放期間,這些音頻對象在三維音頻場景中四處移動。該系統還可以包括所謂的床聲道(bedchannel),所述床聲道可以被描述為直接映射到例如上述傳統音頻系統的揚聲器位置的靜止音頻對象。
在基于對象的音頻系統中可能出現的問題是如何高效地對音頻信號進行編碼和解碼以及保持編碼信號的質量。可能的編碼方案包括:在編碼器側,根據音頻對象和床聲道來創建包括許多聲道的下混信號以及使得能夠在解碼器側重建音頻對象和床聲道的輔助信息。
MPEG空間音頻對象編碼(MPEG SAOC)描述了一種用于對音頻對象進行參數編碼的系統。該系統發送用于上混矩陣的輔助信息,其借助于諸如對象的電平差和互相關性之類的參數來描述對象的屬性。這些參數然后在解碼器側被用來控制音頻對象的重建。該過程在數學上是復雜的,并且常常必須依賴于關于沒有由參數明確描述的音頻對象的屬性的假設。在MPEG SAOC中提出的方法可以降低基于對象的音頻系統所需的比特率,但是可能還需要改進以進一步提高如上所述的效率和質量。
附圖說明
現在將參考附圖來描述示例性實施例,其中:
圖1是根據示例性實施例的音頻編碼系統的概括框圖;
圖2是圖1中所示的示例性上混矩陣編碼器的概括框圖;
圖3示出了參數向量中與由圖1的音頻編碼系統確定的上混矩陣中的元素對應的第一元素的示例性概率分布;
圖4示出了參數向量中與由圖1的音頻編碼系統確定的上混矩陣中的元素對應的至少一個經取模差分編碼的(modulo differential coded)第二元素的示例性概率分布;
圖5是根據示例性實施例的音頻解碼系統的概括框圖;
圖6是圖5中所示的上混矩陣解碼器的概括框圖;
圖7描述了參數向量中與由圖1的音頻編碼系統確定的上混矩陣中的元素對應的第二元素的編碼方法;
圖8描述了參數向量中與由圖1的音頻編碼系統確定的上混矩陣中的元素對應的第一元素的編碼方法;
圖9描述了用于示例性參數向量中的第二元素的圖7的編碼方法的部分;
圖10描述了用于示例性參數向量中的第一元素的圖8的編碼方法的部分;
圖11是圖1中所示的第二示例性上混矩陣編碼器的概括框圖;
圖12是根據示例性實施例的音頻解碼系統的概括框圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比國際公司,未經杜比國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480029565.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有多個圖形界面的媒體回放系統控制器
- 下一篇:混合性能縮放或語音識別





