[發(fā)明專利]用于空間音頻的文件格式有效
| 申請?zhí)枺?/td> | 201880057198.3 | 申請日: | 2018-09-25 |
| 公開(公告)號: | CN111108760B | 公開(公告)日: | 2021-11-26 |
| 發(fā)明(設(shè)計)人: | M·S·康諾利;C·T·尤班克;S·E·平托;T·霍爾曼 | 申請(專利權(quán))人: | 蘋果公司 |
| 主分類號: | H04S7/00 | 分類號: | H04S7/00;G06T19/00;G10L19/008;G10L19/16 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 丁君軍 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 空間 音頻 文件格式 | ||
1.一種用于創(chuàng)建在模擬現(xiàn)實SR應(yīng)用程序中使用的聲音的音頻資源庫的計算機實現(xiàn)的方法,所述方法包括:
接收在其內(nèi)編碼了聲音的音頻數(shù)據(jù);
接收描述所述聲音如何被編碼的元數(shù)據(jù);
創(chuàng)建包含資源元數(shù)據(jù)和所述音頻數(shù)據(jù)的音頻資源,所述資源元數(shù)據(jù)包括i)所接收的元數(shù)據(jù),ii)描述所述聲音將如何通過SR應(yīng)用程序被渲染成空間音頻的元數(shù)據(jù),以及iii)用于在渲染所述音頻資源以供收聽者體驗之前變換所述資源元數(shù)據(jù)的變換參數(shù),所述變換參數(shù)包括表示由所述SR應(yīng)用程序提供的SR環(huán)境中的所述收聽者與所述音頻資源所附加至的SR對象之間的關(guān)系的關(guān)系參數(shù),以及
將所述音頻資源存儲在音頻資源庫中。
2.根據(jù)權(quán)利要求1所述的計算機實現(xiàn)的方法,其中,如何渲染所述聲音包括如何在聲音回放系統(tǒng)中模擬空間聲音。
3.根據(jù)前述權(quán)利要求中任一項所述的計算機實現(xiàn)的方法,其中,所述資源元數(shù)據(jù)中的所述變換參數(shù)實現(xiàn)所述資源元數(shù)據(jù)在所述SR應(yīng)用程序中的動態(tài)變換,其中,所述動態(tài)變換在所述聲音的回放或體驗期間通過應(yīng)用所述關(guān)系參數(shù)來執(zhí)行,以改變所述音頻資源通過所述SR應(yīng)用程序被渲染的方式。
4.根據(jù)權(quán)利要求3所述的計算機實現(xiàn)的方法,其中,所述關(guān)系參數(shù)包括所述收聽者相對于所述SR對象的位置和取向中的任一者,所述位置和取向影響所述音頻資源在所述SR應(yīng)用程序中的渲染。
5.根據(jù)權(quán)利要求4所述的計算機實現(xiàn)的方法,其中,所述收聽者與所述SR對象之間的所述關(guān)系在所述SR環(huán)境中被確定,并且所述關(guān)系用于設(shè)定所述關(guān)系參數(shù),所述關(guān)系參數(shù)用于動態(tài)地變換所述音頻資源在所述SR應(yīng)用程序中的渲染方式。
6.根據(jù)權(quán)利要求1、2、4和5中任一項所述的計算機實現(xiàn)的方法,其中,在其內(nèi)編碼了所述聲音的所述音頻數(shù)據(jù)包括以下各項中的任何一者或多者:
對個體聲音的單耳記錄;
對聲音環(huán)境的多信道記錄,包括使用麥克風(fēng)陣列產(chǎn)生的記錄、多個聲音來源的所記錄混頻(包括多個離散聲音的混頻)以及保留所記錄聲音的空間特征的記錄中的任一者;和
用于產(chǎn)生一個或多個聲音的合成音頻數(shù)據(jù)。
7.根據(jù)權(quán)利要求1、2、4和5中任一項所述的方法,其中,包含在所述音頻資源中的所述資源元數(shù)據(jù)包括:
用于所述音頻資源的全局元數(shù)據(jù);和
用于所述音頻資源的任何一個或多個信道的信道元數(shù)據(jù)。
8.根據(jù)權(quán)利要求1、2、4和5中任一項所述的方法,其中,描述所述聲音如何被編碼的元數(shù)據(jù)描述與所述聲音如何被捕獲相關(guān)聯(lián)的一個或多個特征,并且其中,描述如何渲染所述音頻資源的所述元數(shù)據(jù)包括以下各項中的任何一者或多者:
所述聲音的位置,包括離散位置或使用高階高保真度立體聲響復(fù)制(HOA)格式編碼的位置;
所述聲音的每音頻數(shù)據(jù)信道的至少一個方向特征;
所述聲音的取向,包括每音頻數(shù)據(jù)信道的取向;
所述聲音的初始聲壓水平SPL或者另選的聲音功率水平,包括捕獲所述SPL或所述聲音功率水平時所處的距離;
所述聲音的大小或形狀,所述聲音的所述大小或所述形狀通過多邊形網(wǎng)格或體積大小表達;和
所述聲音的回放速率,包括用于所有音頻數(shù)據(jù)信道的全局回放速率。
9.根據(jù)權(quán)利要求8所述的方法,其中,與所述聲音如何被捕獲相關(guān)聯(lián)的所述一個或多個特征包括對用于捕獲所述聲音的記錄系統(tǒng)的描述,包括對麥克風(fēng)陣列的描述。
10.根據(jù)權(quán)利要求1、2、4、5和9中任一項所述的方法,還包括:
編輯所述音頻資源以添加元數(shù)據(jù),所述元數(shù)據(jù)描述所述音頻資源在所述SR應(yīng)用程序中如何被使用,包括標識所述音頻資源所附加至的所述SR對象。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘋果公司,未經(jīng)蘋果公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880057198.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





