[發(fā)明專利]將多聲道音頻內(nèi)容轉(zhuǎn)換成基于對象的音頻內(nèi)容的方法及用于處理具有空間位置的音頻內(nèi)容的方法有效
| 申請?zhí)枺?/td> | 201780033796.2 | 申請日: | 2017-05-29 |
| 公開(公告)號: | CN109219847B | 公開(公告)日: | 2023-07-25 |
| 發(fā)明(設(shè)計)人: | G·真加勒;A·馬特奧斯·索萊 | 申請(專利權(quán))人: | 杜比國際公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008 |
| 代理公司: | 北京律盟知識產(chǎn)權(quán)代理有限責(zé)任公司 11287 | 代理人: | 劉鋒 |
| 地址: | 荷蘭阿*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多聲道 音頻 內(nèi)容 轉(zhuǎn)換 基于 對象 方法 用于 處理 具有 空間 位置 | ||
本發(fā)明屬于基于對象的音頻內(nèi)容的領(lǐng)域,且更明確來說,本發(fā)明涉及將多聲道音頻內(nèi)容轉(zhuǎn)換成基于對象的音頻內(nèi)容的領(lǐng)域。本發(fā)明進(jìn)一步涉及用于處理具有空間位置的音頻內(nèi)容的時間幀的方法。
技術(shù)領(lǐng)域
本發(fā)明屬于基于對象的音頻內(nèi)容的領(lǐng)域,且更明確來說,本發(fā)明涉及將多聲道音頻內(nèi)容轉(zhuǎn)換成基于對象的音頻內(nèi)容的領(lǐng)域。本發(fā)明進(jìn)一步涉及用于處理具有空間位置的音頻內(nèi)容的時間幀的方法。
背景技術(shù)
近年來,涌現(xiàn)了制作及渲染音頻內(nèi)容的新方式。通過向家庭影院及電影院提供基于對象的音頻內(nèi)容,收聽體驗得以改善,這是因為聲音設(shè)計師及藝術(shù)家可自由地在3D空間中混合音頻,從而通過環(huán)繞聲道控制了效果且使用高度聲道添加了無縫架空維度。傳統(tǒng)上,多聲道格式(立體聲5.1、7.1等等)的音頻內(nèi)容是通過在演播室中混合不同音頻信號來創(chuàng)建,或是通過在真實環(huán)境中同時記錄聲學(xué)信號來生成。混合音頻信號或內(nèi)容可包含多個不同源。源分離是識別每一源的信息以便例如通過單聲道信號及元數(shù)據(jù)(包含空間信息、頻譜信息等等)重建音頻內(nèi)容的任務(wù)。
通過提供用于將傳統(tǒng)音頻內(nèi)容(即,5.1或7.1內(nèi)容)變換為基于對象的音頻內(nèi)容的工具,更多電影標(biāo)題可利用渲染音頻的新方式。此類工具通過將源分離應(yīng)用于傳統(tǒng)音頻內(nèi)容而從傳統(tǒng)音頻內(nèi)容提取音頻對象。
然而,存在將此類對象重新渲染給與傳統(tǒng)音頻內(nèi)容的原始布局(例如5.1布局或7.1布局)類似的布局的情況,這將導(dǎo)致明顯違反混合器的原始意圖,這是因為所重新渲染音頻對象是在與傳統(tǒng)音頻內(nèi)容的混合器的初始意圖不同的聲道中渲染。
此外,經(jīng)過幾年的基于對象的格式的內(nèi)容制作,一些混合技術(shù)作為實現(xiàn)利用由這些新格式提供的創(chuàng)造潛力的美學(xué)成果的方式而在專業(yè)人士當(dāng)中越來越受歡迎。然而,需要用于提供對具有空間位置的音頻內(nèi)容的改善藝術(shù)控制的另外方法以進(jìn)一步利用此類音頻內(nèi)容的創(chuàng)造潛力。
本發(fā)明是在這種背景下形成。
發(fā)明內(nèi)容
一方面,本公開涉及一種用于將多聲道音頻信號的時間幀轉(zhuǎn)換成輸出音頻內(nèi)容的方法,所述輸出音頻內(nèi)容包括音頻對象、包括每一音頻對象的空間位置的元數(shù)據(jù),及音床聲道,其中所述多聲道音頻信號包括處于第一配置的多個聲道,處于所述第一配置的每一聲道具有與揚聲器設(shè)置有關(guān)且在預(yù)定坐標(biāo)系中定義的預(yù)定位置,所述方法包括以下步驟:a)接收所述多聲道音頻信號的所述時間幀,b)從所述多聲道音頻信號的所述時間幀提取至少一個音頻對象,所述音頻對象是從所述多個聲道中的第一多個聲道提取,且對于所述至少一個音頻對象中的每一音頻對象:c)估計所述音頻對象的空間位置,d)基于所述音頻對象的所述空間位置,估計處于所述第一配置的所述第一多個聲道中的所述音頻對象的渲染版本將在具有與從中提取所述對象的所述第一多個聲道的所述預(yù)定位置不同的預(yù)定位置的聲道中渲染的風(fēng)險,e)確定所述風(fēng)險是否超過閾值,及f)在確定所述風(fēng)險未超過所述閾值時,將所述音頻對象及包括所述音頻對象的所述空間位置的元數(shù)據(jù)包含在所述輸出音頻內(nèi)容中。
另一方面,本公開涉及一種計算機(jī)可讀存儲介質(zhì),其具有適于在由具有處理能力的裝置執(zhí)行時實行前述方法的指令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杜比國際公司,未經(jīng)杜比國際公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780033796.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法
- 圖像轉(zhuǎn)換設(shè)備、圖像轉(zhuǎn)換電路及圖像轉(zhuǎn)換方法
- 數(shù)模轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 轉(zhuǎn)換設(shè)備和轉(zhuǎn)換方法
- 占空比轉(zhuǎn)換電路及轉(zhuǎn)換方法
- 通信轉(zhuǎn)換方法、轉(zhuǎn)換裝置及轉(zhuǎn)換系統(tǒng)
- 模數(shù)轉(zhuǎn)換和模數(shù)轉(zhuǎn)換方法
- 轉(zhuǎn)換模塊以及轉(zhuǎn)換電路
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件和熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊
- 熱電轉(zhuǎn)換材料、熱電轉(zhuǎn)換元件及熱電轉(zhuǎn)換模塊





