[發明專利]基于音頻數據流渲染音頻輸出的方法、解碼器系統和介質有效
| 申請號: | 201880015778.6 | 申請日: | 2018-03-06 |
| 公開(公告)號: | CN110447243B | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | K·佩克爾;T·弗雷德里希;R·特辛;H·普恩豪根;M·沃爾特斯 | 申請(專利權)人: | 杜比國際公司 |
| 主分類號: | H04S7/00 | 分類號: | H04S7/00;H04S3/00;G10L19/008 |
| 代理公司: | 北京市漢坤律師事務所 11602 | 代理人: | 魏小薇;吳麗麗 |
| 地址: | 荷蘭阿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 音頻 數據流 渲染 輸出 方法 解碼器 系統 介質 | ||
一種用于基于音頻數據流來渲染音頻輸出的方法,所述音頻數據流包括:M個音頻信號;邊信息,所述邊信息包括重建矩陣C的一系列重建實例和第一時序數據,所述邊信息允許由所述M個音頻信號重建N個音頻對象;以及對象元數據,所述對象元數據定義所述N個音頻對象之間的空間關系。所述方法包括:基于所述對象元數據、所述第一時序數據和與當前回放系統配置相關的信息生成同步渲染矩陣,所述同步渲染矩陣針對每個重建實例都具有渲染實例;將每個重建實例與相應的渲染實例相乘以形成集成渲染矩陣的相應實例;以及將所述集成渲染矩陣應用于所述音頻信號以便渲染音頻輸出。
本申請要求以下優先權申請的優先權:于2017年3月6日提交的美國臨時申請62/467,445(參考號:D16156USP1)和于2017年3月6日提交的EP申請17159391.6(參考號:D16156EP),這些申請通過引用結合于此。
技術領域
本發明總體上涉及包括音頻對象的音頻場景的代碼化(coding)。具體地,本發明涉及用于對一組音頻信號進行解碼和渲染以形成音頻輸出的解碼器和相關聯的方法。
背景技術
音頻場景總體上可以包括音頻對象和音頻通道。音頻對象是具有可以隨時間變化的相關聯空間位置的音頻信號。音頻通道(傳統上)是與多通道揚聲器配置的通道直接相對應的音頻信號,所述多通道揚聲器配置是諸如具有左揚聲器和右揚聲器的經典立體聲配置或具有三個前揚聲器、兩個環繞揚聲器和一個低頻效果揚聲器的所謂5.1揚聲器配置。
由于音頻對象的數量通常可能非常大,例如在數十或數百個音頻對象的數量級,因此需要允許音頻對象在編碼器側被高效地壓縮例如以供作為數據流進行傳輸并且然后在解碼器側被重建的編碼方法。
一個現有技術示例是在編碼器側將音頻對象組合到多通道下混中,并且在解碼器側參數化地重建來自多通道下混的音頻對象,所述多通道下混包括與特定多通道揚聲器配置(諸如5.1配置)的通道相對應的多個音頻通道。
例如在WO2014187991和WO2015150384中公開了這種方法的概括,其中,多通道下混不與特定回放系統相關聯,而是被自適應地選擇。根據這種方法,在編碼器側對N個音頻對象進行下混以形成M個下混音頻信號(MN)。代碼化的數據流包括這些下混音頻信號和使得能夠在解碼器側重建這N個音頻對象的邊信息。數據流進一步包括描述對象之間的空間關系的對象元數據,所述對象元數據允許對這N個音頻對象進行渲染以形成音頻輸出。
文獻WO2014187991和WO2015150384提到可以將重建操作與渲染操作進行組合。然而,所述參考文獻沒有提供如何實現這種組合的進一步細節。
發明內容
本發明的目的是通過將一方面的由M個音頻信號重建N個音頻對象、與另一方面的渲染所述N個音頻對象以形成音頻輸出進行組合,來在解碼器側提供提高的計算效率。
根據本發明的第一方面,這個目的和其他目的通過一種基于數據流的集成渲染方法來實現,所述數據流包括:
-M個音頻信號,所述M個音頻信號是N個音頻對象的組合,其中,N1且M≤N,
-邊信息,所述邊信息包括重建矩陣的一系列重建實例ci和定義所述實例之間的過渡的第一時序數據,所述邊信息允許由所述M個音頻信號重建所述N個音頻對象,以及
-時變對象元數據,所述時變對象元數據包括定義所述N個音頻對象之間的空間關系的一系列元數據實例mi以及定義所述元數據實例之間的過渡的第二時序數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比國際公司,未經杜比國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880015778.6/2.html,轉載請聲明來源鉆瓜專利網。





