[發(fā)明專利]使用自適應(yīng)捕捉從麥克風(fēng)陣列生成空間音頻信號格式在審
| 申請?zhí)枺?/td> | 201780059645.4 | 申請日: | 2017-09-22 |
| 公開(公告)號: | CN109791769A | 公開(公告)日: | 2019-05-21 |
| 發(fā)明(設(shè)計(jì))人: | J·維卡莫;M-V·萊蒂南 | 申請(專利權(quán))人: | 諾基亞技術(shù)有限公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;H04S3/02;H04S5/02;H04S3/00 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 酆迅;董典紅 |
| 地址: | 芬蘭*** | 國省代碼: | 芬蘭;FI |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 麥克風(fēng)音頻信號 空間音頻 信號格式 元數(shù)據(jù) 處理器 麥克風(fēng)陣列 球面諧波 所述空間 音頻信號 自適應(yīng) 捕捉 合成 關(guān)聯(lián) 輸出 配置 | ||
一種裝置,包括處理器,所述處理器被配置為:接收至少兩個(gè)麥克風(fēng)音頻信號;確定與所述至少兩個(gè)麥克風(fēng)音頻信號相關(guān)聯(lián)的空間元數(shù)據(jù);以及基于至少一個(gè)麥克風(fēng)音頻信號和所述空間元數(shù)據(jù)來自適應(yīng)地合成多個(gè)球面諧波音頻信號,以便輸出預(yù)定階的空間音頻信號格式。
技術(shù)領(lǐng)域
本申請涉及用于使用自適應(yīng)信號處理技術(shù)從麥克風(fēng)陣列生成球面諧波信號的裝置和方法。
背景技術(shù)
現(xiàn)有兩種不同類型的空間聲音捕捉和再現(xiàn),它們涉及到以下公開:
1)高保真立體聲(ambisonics),其中使用麥克風(fēng)陣列線性地(非自適應(yīng)地)捕捉球面諧波信號。球面諧波信號可以使用傳統(tǒng)的非自適應(yīng)方法被解碼到揚(yáng)聲器或者以雙聲道的方式被解碼到耳機(jī)。在雙聲道再現(xiàn)中,球面諧波信號可以使用旋轉(zhuǎn)矩陣、基于收聽者的頭部方位而被旋轉(zhuǎn),并且經(jīng)旋轉(zhuǎn)的信號可以隨后以線性方式被雙聲道解碼。
2)自適應(yīng)空間音頻捕捉(SPAC)方法,其采用對來自麥克風(fēng)陣列信號的感知相關(guān)空間信息(例如,頻帶中到來聲音的方向)的動態(tài)分析。該信息——經(jīng)常被稱作空間元數(shù)據(jù)——被應(yīng)用于動態(tài)合成在感知上類似于原始錄制的聲場的空間再現(xiàn)。當(dāng)被妥善實(shí)施時(shí),對于大多數(shù)實(shí)際設(shè)備而言,這樣的自適應(yīng)方法在感知上優(yōu)于高保真立體聲,并且還能夠應(yīng)用于更廣泛的捕捉設(shè)備類型。
高保真立體聲音頻格式(或球面諧波信號)是一種傳統(tǒng)的空間音頻信號表示。近年來,這種信號表示(或格式)也已經(jīng)成為了用于空間音頻傳輸?shù)钠毡閷?shí)施的選擇。其由不同階的球面諧波所構(gòu)成。零階諧波(=零空間頻率)由全向信號所表示。一階諧波由雙極模式表示,并且更高階則具有四極,等等。以下公開中的術(shù)語更高階高保真立體聲(HOA)是指使用零階至二階(或更高階)球面諧波信號的技術(shù)。對于球面諧波信號具有許多變體或配置。例如,球面諧波的相對振幅或排序在不同定義下可能有所變化。任何這樣的變體之間的轉(zhuǎn)換通常使用線性(矩陣)運(yùn)算是直截了當(dāng)?shù)摹?/p>
高保真立體聲音頻格式(或球面諧波信號)也可以被用作用來傳送空間音頻的格式。例如,YouTube 3D音頻/視頻服務(wù)已經(jīng)開始使用由一個(gè)全向信號(零階)和三個(gè)雙極信號(一階)構(gòu)成的一階高保真立體聲格式(球面諧波信號)來流傳輸空間音頻。雖然該方法對于質(zhì)量或比特率而言都不是最優(yōu)的,但是現(xiàn)有的流服務(wù)顯示該方法實(shí)際上為終端用戶產(chǎn)生了令人滿意的體驗(yàn)。此外,高保真立體聲音頻格式是一種直截了當(dāng)?shù)那彝耆x的格式。因此,這對于諸如YouTube等的服務(wù)是一種有用的音頻格式并且相同地使用。使用已知方法,高保真立體聲音頻格式信號可以在接收器端被線性解碼并且被渲染至耳機(jī)(雙聲道)或揚(yáng)聲器。
球面諧波信號的生成存在著問題。為了生成球面諧波信號,可能需要專業(yè)麥克風(fēng)陣列形式的專業(yè)裝置使用線性手段來捕捉信號。用于使用常規(guī)或一般的麥克風(fēng)布置來生成球面諧波信號并且隨后使用線性組合處理麥克風(fēng)信號的其它方式可能產(chǎn)生導(dǎo)致不佳質(zhì)量結(jié)果的球面諧波信號。
發(fā)明內(nèi)容
根據(jù)第一方面,提供了一種裝置,包括處理器,所述處理器被配置為:接收至少兩個(gè)麥克風(fēng)音頻信號;確定與所述至少兩個(gè)麥克風(fēng)音頻信號相關(guān)聯(lián)的空間元數(shù)據(jù);以及基于至少一個(gè)麥克風(fēng)音頻信號和所述空間元數(shù)據(jù)來自適應(yīng)地合成多個(gè)球面諧波音頻信號以便輸出預(yù)定階的空間音頻信號格式。
所述處理器可以進(jìn)一步被配置為從麥克風(fēng)陣列接收所述至少兩個(gè)麥克風(fēng)音頻信號。
所述處理器可以被配置為分析所述至少兩個(gè)麥克風(fēng)音頻信號以確定所述空間元數(shù)據(jù)。
所述處理器可以被配置為進(jìn)一步接收與所述至少兩個(gè)麥克風(fēng)音頻信號相關(guān)聯(lián)的空間元數(shù)據(jù)。
所述多個(gè)球面諧波音頻信號可以是一階球面諧波音頻信號。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于諾基亞技術(shù)有限公司,未經(jīng)諾基亞技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780059645.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 元數(shù)據(jù)存取控制系統(tǒng)及其方法、以及接收裝置、發(fā)送裝置
- 一種云存儲客戶端的低延遲元數(shù)據(jù)訪問方法
- 熱點(diǎn)元數(shù)據(jù)訪問控制方法和服務(wù)器
- 在多個(gè)階段高效地存儲和檢索數(shù)據(jù)和元數(shù)據(jù)的方法和系統(tǒng)
- 元數(shù)據(jù)節(jié)點(diǎn)集群的擴(kuò)容方法、系統(tǒng)、設(shè)備和存儲介質(zhì)
- 一種元數(shù)據(jù)緩存管理方法和裝置
- 元數(shù)據(jù)管理方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 一種元數(shù)據(jù)管理方法及裝置、設(shè)備、存儲介質(zhì)
- 用于存儲管理的方法、設(shè)備和計(jì)算機(jī)程序產(chǎn)品
- 論文元數(shù)據(jù)的檢測方法及裝置





