[發(fā)明專利]空間聲音渲染有效
| 申請?zhí)枺?/td> | 201980035666.1 | 申請日: | 2019-03-25 |
| 公開(公告)號: | CN112219411B | 公開(公告)日: | 2022-08-02 |
| 發(fā)明(設(shè)計)人: | A·埃羅南;M-V·萊蒂南;J·維爾卡莫;L·拉克索寧;A·拉莫 | 申請(專利權(quán))人: | 諾基亞技術(shù)有限公司 |
| 主分類號: | H04S3/00 | 分類號: | H04S3/00;H04S7/00;H04R3/00 |
| 代理公司: | 北京市中咨律師事務(wù)所 11247 | 代理人: | 楊曉光 |
| 地址: | 芬蘭*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 空間 聲音 渲染 | ||
一種用于空間音頻信號解碼的裝置,所述裝置包括至少一個處理器和至少一個包括計算機程序代碼的存儲器,所述至少一個存儲器和所述計算機程序代碼被配置為與所述至少一個處理器一起使所述裝置至少:接收至少一個相關(guān)聯(lián)的音頻信號,所述至少一個相關(guān)聯(lián)的音頻信號基于空間音頻信號;與所述至少一個相關(guān)聯(lián)的音頻信號相關(guān)聯(lián)的空間元數(shù)據(jù),所述空間元數(shù)據(jù)包括表示所述空間音頻信號的環(huán)境能量分布的至少一個參數(shù)和表示所述空間音頻信號的定向信息的至少一個定向參數(shù);基于所述至少一個定向參數(shù)和所述至少一個參數(shù)從所述至少一個相關(guān)聯(lián)的音頻信號合成至少一個輸出音頻信號,其中,所述至少一個參數(shù)控制所述至少一個輸出信號的環(huán)境能量分布。
技術(shù)領(lǐng)域
本申請涉及用于空間聲音渲染的裝置和方法。這包括但不限于用于多聲道揚聲器設(shè)置的空間聲音渲染。
背景技術(shù)
參數(shù)化空間音頻處理是音頻信號處理的一個領(lǐng)域,其中使用參數(shù)集描述聲音的空間方面。例如,在從麥克風(fēng)陣列進(jìn)行參數(shù)化空間音頻捕獲中,從麥克風(fēng)陣列信號中估計參數(shù)集是一種典型而有效的選擇,該參數(shù)集例如頻帶中聲音的方向,以及表示在頻帶中所捕獲聲音的定向和非定向部分的相對能量的比率參數(shù)。眾所周知,這些參數(shù)很好地描述了麥克風(fēng)陣列的位置處的所捕獲聲音的感知空間特性。這些參數(shù)可以相應(yīng)地用于空間聲音的合成,用于雙耳式耳機、用于揚聲器或其他格式,例如全景聲(Ambisonics)。
因此,頻帶中的方向和直接與總體能量比(direct-to-total energy ratio)是對空間音頻捕獲特別有效的參數(shù)化。
由頻帶中的方向參數(shù)和頻帶中的能量比參數(shù)(指示定向的聲音能量的比例)組成的參數(shù)集也可以用作用于音頻編解碼器的空間元數(shù)據(jù)。例如,可以從麥克風(fēng)陣列捕獲的音頻信號估計這些參數(shù),并且例如可以從麥克風(fēng)陣列信號生成立體聲信號,以與空間元數(shù)據(jù)一起傳送。立體聲信號可以例如用AAC編碼器編碼。解碼器可以將音頻信號解碼為PCM信號,并處理頻帶中的聲音(使用空間元數(shù)據(jù))以獲取空間輸出,例如雙耳輸出。
參數(shù)化編碼器輸入格式可以是一種或幾種輸入格式。示例輸入格式是一階全景聲(FOA)格式。在與定向音頻編碼(DirAC)和諧波平面波擴展(Harpex)相關(guān)的科學(xué)文獻(xiàn)中記錄了分析FOA輸入以進(jìn)行空間元數(shù)據(jù)提取。這是因為存在能夠直接提供FOA信號(或者具體來說是變體,B格式信號)的專業(yè)麥克風(fēng)陣列,并且已經(jīng)實現(xiàn)了對這種輸入的分析。
發(fā)明內(nèi)容
提供了一種裝置,該裝置包括至少一個處理器和至少一個包括計算機程序代碼的存儲器,所述至少一個存儲器和所述計算機程序代碼被配置為與所述至少一個處理器一起使所述裝置至少:接收至少一個相關(guān)聯(lián)的音頻信號,所述至少一個相關(guān)聯(lián)的音頻信號基于空間音頻信號;與所述至少一個相關(guān)聯(lián)的音頻信號相關(guān)聯(lián)的空間元數(shù)據(jù),所述空間元數(shù)據(jù)包括表示所述空間音頻信號的環(huán)境能量分布的至少一個參數(shù)和表示所述空間音頻信號的定向信息的至少一個定向參數(shù);基于所述至少一個定向參數(shù)和所述至少一個參數(shù)從所述至少一個相關(guān)聯(lián)的音頻信號合成至少一個輸出音頻信號,其中,所述至少一個參數(shù)控制所述至少一個輸出信號的環(huán)境能量分布。
被致使基于所述至少一個定向參數(shù)和所述至少一個參數(shù)從所述至少一個相關(guān)聯(lián)的音頻信號合成至少一個輸出音頻信號的所述裝置,其中,所述至少一個參數(shù)控制所述至少一個輸出信號的環(huán)境能量分布,可以被進(jìn)一步致使:基于所述空間元數(shù)據(jù)將所述至少一個相關(guān)聯(lián)的音頻信號劃分為直接部分和漫射(diffuse)部分;基于所述至少一個相關(guān)聯(lián)的音頻信號的所述直接部分和所述至少一個定向參數(shù)來合成直接音頻信號;基于表示所述至少一個空間音頻信號的環(huán)境能量分布的所述至少一個參數(shù),確定漫射部分增益;基于所述至少一個相關(guān)聯(lián)的音頻信號的所述漫射部分和所述漫射部分增益來合成漫射音頻信號;以及組合所述直接音頻信號和所述漫射音頻信號以生成所述至少一個輸出音頻信號。
被致使基于所述至少一個相關(guān)聯(lián)的音頻信號的所述漫射部分來合成漫射音頻信號的所述裝置可以被致使:對所述至少一個相關(guān)聯(lián)的音頻信號進(jìn)行去相關(guān)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于諾基亞技術(shù)有限公司,未經(jīng)諾基亞技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980035666.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





