[發(fā)明專(zhuān)利]具有離散對(duì)象的音頻的分層編碼在審
| 申請(qǐng)?zhí)枺?/td> | 202010824443.8 | 申請(qǐng)日: | 2020-08-17 |
| 公開(kāi)(公告)號(hào): | CN112562696A | 公開(kāi)(公告)日: | 2021-03-26 |
| 發(fā)明(設(shè)計(jì))人: | D·森;F·鮑姆加特;J·O·瑪麗瑪 | 申請(qǐng)(專(zhuān)利權(quán))人: | 蘋(píng)果公司 |
| 主分類(lèi)號(hào): | G10L19/008 | 分類(lèi)號(hào): | G10L19/008;G10L19/02;G10L19/16;G10L19/26 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 黃倩 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 具有 離散 對(duì)象 音頻 分層 編碼 | ||
本公開(kāi)涉及具有離散對(duì)象的音頻的分層編碼。具有第一組高保真度立體聲響復(fù)制音頻分量的第一層數(shù)據(jù)能夠被解碼,其中該第一組高保真度立體聲響復(fù)制音頻分量是基于環(huán)境和一個(gè)或多個(gè)基于對(duì)象的音頻信號(hào)生成的。具有該一個(gè)或多個(gè)基于對(duì)象的音頻信號(hào)中的至少一個(gè)基于對(duì)象的音頻信號(hào)的第二層數(shù)據(jù)被解碼。從該第一組高保真度立體聲響復(fù)制音頻分量中減去該基于對(duì)象的音頻信號(hào)中的一個(gè)基于對(duì)象的音頻信號(hào)。渲染所得的高保真度立體聲響復(fù)制音頻分量以生成第一組音頻聲道。一個(gè)或多個(gè)基于對(duì)象的音頻信號(hào)被空間地渲染以生成第二組音頻聲道。其他方面也有所描述并受權(quán)利要求書(shū)保護(hù)。
技術(shù)領(lǐng)域
本公開(kāi)的一個(gè)方面涉及具有離散對(duì)象的音頻的分層編碼。
背景技術(shù)
音頻信號(hào)可具有不同的格式。傳統(tǒng)的基于聲道的音頻是針對(duì)收聽(tīng)設(shè)備例如具有五個(gè)揚(yáng)聲器和一個(gè)低音音箱的5.1家庭影院而記錄的。基于對(duì)象的音頻將音頻源編碼成具有元數(shù)據(jù)的對(duì)象,該元數(shù)據(jù)描述關(guān)于該對(duì)象的空間信息。
發(fā)明內(nèi)容
以音頻的分層編碼來(lái)?yè)Q取空間分辨率具有挑戰(zhàn)性。傳統(tǒng)音頻是基于聲道的,例如5.1或4.1。基于聲道的音頻不適于被分層,因?yàn)槿绻暤辣灰暈閷樱瑒t層的不存在會(huì)是明顯且分散注意力的,因?yàn)槿绻惶幚韺?duì)應(yīng)的層,則整個(gè)揚(yáng)聲器可能被關(guān)閉或靜音。類(lèi)似地,當(dāng)多個(gè)對(duì)象(例如,聲源)構(gòu)成聲場(chǎng)時(shí),如果對(duì)象被視為層而沒(méi)有任何附加措施,則對(duì)象中一者或多者的不存在可能導(dǎo)致聲場(chǎng)的錯(cuò)誤表示。
高保真度立體聲響復(fù)制具有固有層級(jí)格式。每個(gè)增加階(例如,一階、二階、三階等)在回放給收聽(tīng)者時(shí)增加空間分辨率。高保真度立體聲響復(fù)制可以被格式化具有僅低階高保真度立體聲響復(fù)制,諸如具有一階 W、X、Y和Z。這種格式盡管具有相對(duì)低的帶寬占用,但提供低空間分辨率。對(duì)于高分辨率沉浸式空間音頻體驗(yàn)通常需要更高階高保真度立體聲響復(fù)制分量。
對(duì)象可被轉(zhuǎn)換成高保真度立體聲響復(fù)制,并且高保真度立體聲響復(fù)制的自然層級(jí)結(jié)構(gòu)然后隨著高保真度立體聲響復(fù)制信號(hào)的階增大可允許更大的空間分辨率和對(duì)象細(xì)節(jié)。不管包括多少分量,單獨(dú)這種方法缺少渲染不同聲源(對(duì)象)的靈活性,因?yàn)槟切┞曉丛诟弑U娑攘Ⅲw聲響復(fù)制音頻信號(hào)中被硬編碼。能夠分別訪問(wèn)對(duì)象就允許回放設(shè)備提供這些對(duì)象的高分辨率渲染以及能夠獨(dú)立地操縱每個(gè)對(duì)象,例如,對(duì)象實(shí)際上可在聲場(chǎng)周?chē)苿?dòng),隨意地添加和移除,和/或使其級(jí)別獨(dú)立于音頻體驗(yàn)中的其他聲音來(lái)調(diào)節(jié)。
不同的回放設(shè)備也可能具有不同的回放能力。例如,回放設(shè)備可具有向用戶渲染近場(chǎng)音頻的能力。可能有利的是,此類(lèi)回放設(shè)備接收具有基于對(duì)象的信號(hào)的比特流以在近場(chǎng)中渲染。然而,第二回放設(shè)備可能無(wú)法渲染近場(chǎng)音頻。在這種情況下,如果基于對(duì)象的信號(hào)從一個(gè)設(shè)備傳輸?shù)搅硪辉O(shè)備,則該信號(hào)可能變得不使用,這可能導(dǎo)致帶寬浪費(fèi)。
缺少對(duì)高保真度立體聲響復(fù)制音頻分量和基于對(duì)象的音頻分層的混合音頻處理技術(shù)。此類(lèi)混合技術(shù)是有益的,因?yàn)閷?duì)象允許近場(chǎng)效應(yīng)、精確定位以及交互性。對(duì)象事實(shí)上可在認(rèn)為適當(dāng)?shù)那闆r下四處移動(dòng),和/或使其級(jí)別改變,和/或在認(rèn)為適當(dāng)?shù)那闆r下從音頻場(chǎng)景添加或移除。高保真度立體聲響復(fù)制還可以提供有吸引力的空間環(huán)境再現(xiàn)。
在本公開(kāi)的一個(gè)方面,描述了一種混合音頻處理技術(shù)。該過(guò)程包括基于環(huán)境和一個(gè)或多個(gè)基于對(duì)象的音頻信號(hào)生成具有第一組高保真度立體聲響復(fù)制音頻分量(例如,僅一階,或僅一階和二階)的基礎(chǔ)層。在該第一組中,基于對(duì)象的音頻信號(hào)可被轉(zhuǎn)換成高保真度立體聲響復(fù)制分量,然后與也為高保真度立體聲響復(fù)制格式的環(huán)境組合。該基礎(chǔ)層可完全表示所期望的音頻場(chǎng)景,因?yàn)槠渚哂斜晦D(zhuǎn)換成高保真度立體聲響復(fù)制分量的在環(huán)境中捕獲的聲音以及來(lái)自各個(gè)聲源的聲音。第一組高保真度立體聲響復(fù)制音頻分量以及還未被轉(zhuǎn)換成高保真度立體聲響復(fù)制的任選數(shù)量的對(duì)象(和相關(guān)聯(lián)元數(shù)據(jù))可被包括在被編碼到比特流中的基礎(chǔ)(或第一)層中。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于蘋(píng)果公司,未經(jīng)蘋(píng)果公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010824443.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:多功能水田拖拉機(jī)
- 下一篇:可自動(dòng)駕駛的車(chē)輛
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 對(duì)象選擇裝置、對(duì)象選擇程序及對(duì)象選擇方法
- 對(duì)象顯示裝置、對(duì)象顯示系統(tǒng)以及對(duì)象顯示方法
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象顯示裝置、對(duì)象顯示方法和對(duì)象顯示程序
- 對(duì)象分析方法、對(duì)象分析設(shè)備及對(duì)象分析系統(tǒng)
- 對(duì)象索引方法、對(duì)象搜索方法及對(duì)象索引系統(tǒng)
- 對(duì)象分類(lèi)方法和對(duì)象分類(lèi)設(shè)備
- 對(duì)象庫(kù)中的對(duì)象簽名
- 對(duì)象追蹤方法、對(duì)象追蹤系統(tǒng)以及對(duì)象追蹤程序
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





