[發明專利]用于改善對多聲道音頻信號的呈現的方法和設備有效
| 申請號: | 201380038438.2 | 申請日: | 2013-07-19 |
| 公開(公告)號: | CN104471641B | 公開(公告)日: | 2017-09-12 |
| 發明(設計)人: | 奧利弗·威伯特;約翰內斯·伯姆;彼得·杰克斯 | 申請(專利權)人: | 杜比國際公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所11038 | 代理人: | 程連貞 |
| 地址: | 荷蘭阿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 改善 多聲道 音頻 信號 呈現 方法 設備 | ||
1.一種用于對預處理的音頻數據進行編碼的方法,包括以下步驟:
-針對音頻數據,檢測至少三個不同類型的音頻數據類型,所述類型包括第一高階立體聲HOA格式、利用多個麥克風的給定設置進行的麥克風記錄、以及根據特定平移混合的多聲道音頻流;
-如果根據檢測所述音頻數據具有第一HOA格式,則通過逆離散球面諧波變換iDSHT(423),將第一HOA格式的音頻數據的系數變換為不同的第二HOA格式的系數;
-如果根據檢測所述音頻數據具有第一HOA格式,則對音頻數據或所述第二HOA格式的系數進行編碼;以及
-對輔助數據進行編碼,所述輔助數據表示對音頻數據的特定音頻預處理,所述輔助數據至少包括與虛擬或實際揚聲器位置有關的元數據以及與音頻數據有關的混合信息,所述混合信息包括第一HOA格式的詳情、多個麥克風的給定設置和所述特定平移的詳情中的至少一個的詳情。
2.根據權利要求1所述的方法,其中從音頻制作階段(10)獲得所述預處理的音頻數據以及至少一部分的輔助數據,所獲得的那部分輔助數據包括修改信息、編輯信息和合成信息中的至少一個。
3.根據權利要求2所述的方法,其中所述音頻制作階段(10)執行記錄、混合和聲音合成中的至少一個。
4.根據權利要求1所述的方法,其中所述輔助數據表示根據HOA內容得到所述音頻內容加上以下內容中的至少一個:HOA內容表示的階次,2D、3D或半球面表示以及空間采樣點的位置。
5.根據權利要求1所述的方法,其中所述輔助數據表示使用VBAP合成地混合音頻內容,加上對VBAP成對揚聲器或三個一組揚聲器的分配。
6.根據權利要求1所述的方法,其中所述輔助數據表示用固定分散的麥克風記錄所述音頻內容加上以下內容中的至少一個:一個或更多個麥克風在記錄設備上的一個或更多個位置和方向;以及一個或更多個類型的麥克風。
7.一種用于對編碼的音頻數據進行解碼的方法,包括以下步驟:
-確定該編碼的音頻數據在編碼之前是否已被預處理;
-對音頻數據進行解碼;
-從接收到的數據提取與預處理有關的信息,所述信息至少包括與虛擬或實際揚聲器位置有關的元數據以及與音頻數據有關的混合信息,所述混合信息包括第一HOA格式的詳情、多個麥克風的設置和特定平移的詳情中的至少一個的詳情;以及
-根據所提取的預處理信息,對解碼的音頻數據進行后處理,
其中基于音頻數據具有第一HOA格式,基于離散球面諧波變換(DSHT)將音頻數據的系數從第二HOA格式變換為第一HOA格式。
8.根據權利要求7所述的方法,其中所述與預處理有關的信息表示根據HOA內容得到音頻內容加上以下內容中的至少一個:HOA內容表示的階次,2D、3D或半球面表示以及空間采樣點的位置。
9.根據權利要求7所述的方法,其中所述與預處理有關的信息表示使用VBAP合成地混合音頻內容加上對成對VBAP或三個一組揚聲器的分配。
10.根據權利要求7所述的方法,其中所述與預處理有關的信息指示用固定分散的麥克風記錄所述音頻內容加上以下內容中的至少一個:一個或更多個麥克風在記錄設備上的一個或更多個位置和方向;以及一個或更多個類型的麥克風。
11.根據權利要求7所述的方法,其中所述元數據的使用是可選的并且所述元數據的使用是可接通或關斷的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比國際公司,未經杜比國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380038438.2/1.html,轉載請聲明來源鉆瓜專利網。





