[發(fā)明專利]用于使用擴散分量進行與基于DirAC的空間音頻編碼有關(guān)的編碼、解碼、場景處理和其他過程的裝置、方法和計算機程序在審
| 申請?zhí)枺?/td> | 201980091648.5 | 申請日: | 2019-12-06 |
| 公開(公告)號: | CN113439303A | 公開(公告)日: | 2021-09-24 |
| 發(fā)明(設(shè)計)人: | 紀堯姆·福克斯;奧利弗·蒂爾加特;斯里坎特·科塞;斯特凡·朵拉;馬爾庫斯·穆特魯斯;法比安·庫奇;亞歷山德拉·博塞翁;安德里亞·艾森瑟;斯特凡·拜耳 | 申請(專利權(quán))人: | 弗勞恩霍夫應(yīng)用研究促進協(xié)會 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;H04S7/00 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋融冰 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 使用 擴散 分量 進行 基于 dirac 空間 音頻 編碼 有關(guān) 解碼 場景 處理 其他 | ||
一種用于從包括一個或多個聲道的輸入信號產(chǎn)生聲場描述的裝置,包括用于從輸入信號獲取擴散性數(shù)據(jù)的輸入信號分析器(600);聲音分量發(fā)生器(650),用于從輸入信號產(chǎn)生第一組聲場分量的一個或多個聲場分量,對于每一個聲場分量,所述第一組聲場分量具有直達分量和擴散分量,并且用于從所述輸入信號產(chǎn)生第二組聲場分量,所述第二組聲場分量僅具有直達分量,其中所述聲音分量發(fā)生器被配置成當產(chǎn)生所述第一組聲場分量時執(zhí)行能量補償,所述能量補償取決于所述擴散性數(shù)據(jù)、以及所述第二組聲場分量中的聲場分量的數(shù)量、所述第一組聲場分量中的擴散分量的數(shù)量、所述第一組聲場分量的聲場分量的最大階和所述第二組聲場分量的聲場分量的最大階中的至少一個。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻編碼,并且特別涉及使用一個或多個聲音分量生成器從輸入信號產(chǎn)生聲場描述。
背景技術(shù)
方向性音頻編碼(Directional Audio Coding,DirAC)技術(shù)(參考文獻[1])是一種分析和再現(xiàn)空間聲音的有效方法。DirAC使用基于到達方向(direction of arrival,DOA)和針對每頻帶測量的擴散性的聲場的知覺激勵表示。它是基于這樣的假設(shè),即在一個時刻和在一個關(guān)鍵頻帶,聽覺系統(tǒng)的空間分辨率受限于對用于方向的一個提示和用于耳間連貫性的另一提示進行解碼。然后,空間聲音通過交叉衰減的兩個流在頻域中呈現(xiàn),這兩個流是非方向擴散流和方向非擴散流。
DirAC最初用于錄制B格式聲音,但是也可以延伸用于匹配特定揚聲器設(shè)置(例如5.1(參考文獻[2]))或者任何麥克風(fēng)陣列的配置(參考文獻[5])的麥克風(fēng)信號。在最新的案例中,通過錄制中間格式的信號而不是錄制用于特定揚聲器設(shè)置的信號可以實現(xiàn)更多的靈活性。
已在實際中良好建立的這種中間格式是通過(高階)球形環(huán)繞聲(參考文獻[3])來呈現(xiàn)的。可以從球形環(huán)繞聲信號產(chǎn)生每一個期望的揚聲器設(shè)置的信號,包括用于耳機再現(xiàn)的雙耳信號。這要求使用線性球形環(huán)繞聲渲染器(參考文獻[3])或者參數(shù)渲染器(例如方向性音頻編碼(DirAC)),將特定的渲染器(renderer)應(yīng)用于球形環(huán)繞聲信號。
球形環(huán)繞聲信號可以呈現(xiàn)為多聲道信號,其中每一個聲道(稱為球形環(huán)繞聲分量)等效于所謂的空間基函數(shù)的系數(shù)。以這些空間基函數(shù)的加權(quán)和(利用對應(yīng)于這些系數(shù)的權(quán)值),可以重建在錄制位置中的原始聲場(參考文獻[3])。因此,空間基函數(shù)系數(shù)(即,球形環(huán)繞聲分量)表示錄制位置中的聲場的緊湊描述。存在有不同類型的空間基函數(shù),例如球形諧波(spherical harmonics,SH)(參考文獻[3])或者圓柱諧波(cylindrical harmonics,CH)(參考文獻[3])。當描述在2D空間中的聲場時(例如,用于2D聲音再現(xiàn)),可以使用CH,而SH可以用來描述在2D與3D空間中的聲場(例如,用于2D與3D聲音再現(xiàn))。
例如,從特定方向到達的音頻信號f(t)產(chǎn)生空間音頻信號該空間音頻信號可以通過擴展球形諧波直到截斷階H,以球形環(huán)繞聲格式呈現(xiàn):
其中是階l和模m的球形諧波,并且φlm(t)是擴展系數(shù)。通過增加截斷階H,該擴展產(chǎn)生更精確的空間表示。在圖1a中,針對階n和模m示出具有球形環(huán)繞聲聲道編號(Ambisonics Channel Numbering,ACN)索引的直到階H=4的球形諧波。
DirAC已經(jīng)擴展用于從第一階球形環(huán)繞聲信號(first order Ambisonicssignal)(FOA,稱為B格式)或者從不同的麥克風(fēng)陣列遞送更高階的球形環(huán)繞聲信號(參考文獻[5])。這份文件著重于一種更有效率的方法,用于從DirAC參數(shù)和參考信號來合成高階球形環(huán)繞聲信號。在這份文件中,該參考信號,也稱為降混(down-mix)信號,被視為更高階的球形環(huán)繞聲信號的子集或者該球形環(huán)繞聲分量的子集的線性組合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于弗勞恩霍夫應(yīng)用研究促進協(xié)會,未經(jīng)弗勞恩霍夫應(yīng)用研究促進協(xié)會許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980091648.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:間歇性監(jiān)測
- 下一篇:車輛用控制裝置及車輛用控制方法





