[發明專利]用于MPEG-H 3D音頻的三自由度(3DOF+)擴展的方法、設備和系統有效
| 申請號: | 201980018139.X | 申請日: | 2019-04-09 |
| 公開(公告)號: | CN111886880B | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 克里斯托弗·費爾施;利昂·特連蒂夫;丹尼爾·費希爾 | 申請(專利權)人: | 杜比國際公司 |
| 主分類號: | H04S7/00 | 分類號: | H04S7/00;G06F3/01 |
| 代理公司: | 北京律盟知識產權代理有限責任公司 11287 | 代理人: | 劉鋒 |
| 地址: | 荷蘭阿*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 mpeg 音頻 自由度 dof 擴展 方法 設備 系統 | ||
描述了一種處理指示音頻對象的對象位置的位置信息的方法,其中所述對象位置可用于渲染所述音頻對象,所述方法包括:獲得指示收聽者頭部的朝向的收聽者朝向信息;獲得指示所述收聽者頭部的位移的收聽者位移信息;根據所述位置信息確定所述對象位置;通過對所述對象位置應用平移基于所述收聽者位移信息修改所述對象位置;以及基于所述收聽者朝向信息進一步修改經過修改的對象位置。進一步描述了一種用于處理指示音頻對象的對象位置的位置信息的對應設備,其中所述對象位置可用于渲染所述音頻對象。
本申請要求以下優先權申請的優先權:于2018年4月9日提交的美國臨時申請62/654,915(參考:D18045USP1);于2018年7月9日提交的美國臨時申請62/695,446(參考:D18045USP2)和于2019年3月25日提交的美國臨時申請62/823,159(參考:D18045USP3),所述美國臨時申請通過引用并入本文。
技術領域
本公開涉及用于處理指示音頻對象位置的位置信息和指示收聽者頭部位置位移的信息的方法和設備。
背景技術
ISO/IEC 23008-3MPEG-H 3D音頻標準的第一版本(2015年10月15日)和修正案1-4沒有規定允許用戶頭部在三自由度(3DoF)環境中的一定小的平移移動。
發明內容
ISO/IEC 23008-3MPEG-H 3D音頻標準的第一版本(2015年10月15日)和修正案1-4提供了用于3DoF環境的可能性的功能,其中用戶(收聽者)執行頭部旋轉動作。然而,此類功能最多僅支持旋轉場景位移信號傳遞和對應的渲染。這意指在收聽者頭部朝向改變的情況下,音頻場景可以保持空間上固定,這對應于3DoF性質。然而,在當前MPEG-H 3D音頻生態系統內,不可能考慮用戶頭部的一定小的平移移動。
因此,需要用于處理音頻對象的位置信息的方法和設備,所述方法和設備可以潛在地結合用戶頭部的旋轉移動來考慮用戶頭部的一定小的平移移動。
本公開提供了用于處理位置信息的設備和系統,所述設備和系統具有相應的獨立權利要求和從屬權利要求的特征。
根據本公開的一方面,描述了一種處理指示音頻對象位置的位置信息的方法,其中所述處理可以符合MPEG-H 3D音頻標準。所述對象位置可以用于渲染所述音頻對象。音頻對象可以與其位置信息一起包含在基于對象的音頻內容中。位置信息可以是音頻對象的元數據(的一部分)。音頻內容(例如,音頻對象以及其位置信息)可以在經編碼音頻位流中傳送。所述方法可以包含接收音頻內容(例如,經編碼音頻位流)。所述方法可以包含獲得指示收聽者頭部的朝向的收聽者朝向信息。收聽者可以被稱為(例如執行所述方法的音頻解碼器的)用戶。收聽者頭部的朝向(收聽者朝向)可以是收聽者頭部相對于標稱朝向的朝向。所述方法可以進一步包含獲得指示收聽者頭部的位移的收聽者位移信息。收聽者頭部的位移可以是相對于標稱收聽位置的位移。標稱收聽位置(或標稱收聽者位置)可以是默認位置(例如,預定位置、收聽者頭部的預期位置或揚聲器布置的最佳點)。收聽者朝向信息和收聽者位移信息可以通過MPEG-H 3D音頻解碼器輸入接口獲得。收聽者朝向信息和收聽者位移信息可以基于傳感器信息導出。朝向信息和位置信息的組合可以被稱為姿勢信息。所述方法可以進一步包含根據所述位置信息確定所述對象位置。例如,對象位置可以從位置信息中提取。對象位置的確定(例如,提取)可以進一步基于關于收聽環境中一或多個揚聲器的揚聲器布置的幾何形狀的信息。對象位置也可以被稱為音頻對象的信道位置。所述方法可以進一步包含通過對所述對象位置應用平移基于所述收聽者位移信息修改所述對象位置。修改對象位置可以涉及針對收聽者頭部從標稱收聽位置的位移糾正對象位置。換句話說,修改對象位置可以涉及對對象位置應用位置位移補償。所述方法可以又進一步包含例如,通過對經過修改的對象位置應用旋轉變換(例如,相對于所述收聽者頭部或所述標稱收聽位置的旋轉)基于所述收聽者朝向信息進一步修改經過修改的對象位置。進一步修改用于渲染音頻對象的經過修改的對象位置可以涉及旋轉音頻場景位移。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比國際公司,未經杜比國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980018139.X/2.html,轉載請聲明來源鉆瓜專利網。





