[發明專利]具有離散對象的音頻的分層編碼在審
| 申請號: | 202010824443.8 | 申請日: | 2020-08-17 |
| 公開(公告)號: | CN112562696A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | D·森;F·鮑姆加特;J·O·瑪麗瑪 | 申請(專利權)人: | 蘋果公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/02;G10L19/16;G10L19/26 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 黃倩 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 具有 離散 對象 音頻 分層 編碼 | ||
1.一種用于解碼分層音頻的方法,包括:
從由上游設備生成的比特流解碼具有第一組高保真度立體聲響復制音頻分量的第一層數據,所述第一組高保真度立體聲響復制音頻分量是基于環境和一個或多個基于對象的音頻信號而生成的;
從所述比特流解碼具有所述一個或多個基于對象的音頻信號中的至少一個基于對象的音頻信號的第二層數據;
從所述第一組高保真度立體聲響復制音頻分量減去所述一個或多個基于對象的音頻信號中的所述至少一個基于對象的音頻信號,并渲染所得的第一組高保真度立體聲響復制音頻分量以生成第一組音頻聲道;
空間渲染所述一個或多個基于對象的音頻信號以生成第二組音頻聲道;
組合所述第一組音頻聲道和所述第二組音頻聲道,所組合的音頻聲道用于驅動回放設備的多個揚聲器。
2.根據權利要求1所述的方法,還包括基于帶寬將請求傳送給所述上游設備,以在所述比特流中包括所述第二層數據。
3.根據權利要求1所述的方法,其中所述第二層數據包括不與所述第二層的所述一個或多個基于對象的音頻信號中的所述至少一個基于對象的音頻信號混合的第二組高保真度立體聲響復制音頻分量,并且所述方法還包括將所述第二組高保真度立體聲響復制音頻分量級聯到所述第一組高保真度立體聲響復制音頻分量。
4.根據權利要求1所述的方法,還包括:
基于帶寬向所述上游設備傳送請求以在所述比特流中包括第三層數據;以及
對在所述比特流中接收的所述第三層數據進行解碼,所述第三層包括所述一個或多個基于對象的音頻信號中的至少另一個基于對象的音頻信號或第三組高保真度立體聲響復制音頻分量。
5.根據權利要求1所述的方法,還包括基于所述回放設備的設備能力向上游設備傳送請求,以包括所述比特流中的所述第二層數據、或附加增強層。
6.根據權利要求5所述的方法,其中所述設備能力包括以下中的一者或多者:近場回放能力、計算能力、聲學回放能力、在高度范圍處渲染聲音的能力、或以環繞格式渲染聲音的能力。
7.根據權利要求1所述的方法,還包括基于收聽者的觀看位置、所述收聽者所面向的方向、或所述收聽者已指示的方向向上游設備傳送請求以包括所述比特流中的所述第二層數據、或附加增強層。
8.根據權利要求1所述的方法,還包括基于優選位置向上游設備傳送請求以包括所述比特流中的所述第二層數據、或附加增強層。
9.根據權利要求1所述的方法,其中所述第一層數據包括所述一個或多個基于對象的音頻信號中不與所述第一組高保真度立體聲響復制音頻分量混合的一個基于對象的音頻信號。
10.一種用于對分層音頻比特流進行編碼的方法,包括:
基于環境和一個或多個基于對象的音頻信號生成第一組高保真度立體聲響復制音頻分量;
將具有所述第一組高保真度立體聲響復制音頻分量的第一層編碼到比特流中;以及
將具有所述一個或多個基于對象的音頻信號中的至少一者的第二層編碼到所述比特流中。
11.根據權利要求10所述的方法,還包括在所述第二層中編碼第二組高保真度立體聲響復制音頻分量,所述第二組高保真度立體聲響復制音頻分量中的每個分量具有比所述第一組高保真度立體聲響復制音頻分量中的每個分量更高的階。
12.根據權利要求10所述的方法,其中所述第一組高保真度立體聲響復制音頻分量包括全指向(W)音頻分量、在第一方向(X)上對準的第一雙指向音頻分量、在第二方向(Y)上對準的第二雙指向音頻分量和在第三方向(Z)上對準的第三雙指向音頻分量,并且所述比特流的所述第一層不包含其他編碼的高保真度立體聲響復制音頻分量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘋果公司,未經蘋果公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010824443.8/1.html,轉載請聲明來源鉆瓜專利網。





