[發(fā)明專利]用于在多聲道音頻格式之間進(jìn)行轉(zhuǎn)換的方法和設(shè)備無效
| 申請?zhí)枺?/td> | 200880009025.0 | 申請日: | 2008-02-01 |
| 公開(公告)號: | CN101669167A | 公開(公告)日: | 2010-03-10 |
| 發(fā)明(設(shè)計)人: | V·普爾基;J·赫爾 | 申請(專利權(quán))人: | 弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;H04S3/02 |
| 代理公司: | 江門嘉權(quán)專利商標(biāo)事務(wù)所有限公司 | 代理人: | 張 萍 |
| 地址: | 德國*** | 國省代碼: | 德國;DE |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 多聲道 音頻格式 之間 進(jìn)行 轉(zhuǎn)換 方法 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種關(guān)于如何以最大可能的質(zhì)量在不同的多聲道音頻格式之間進(jìn)行轉(zhuǎn)換的技術(shù),而不限于特定的多聲道表示。即本發(fā)明涉及一種允許在任意多聲道格式之間進(jìn)行轉(zhuǎn)換的技術(shù)。
背景技術(shù)
通常,在多聲道再現(xiàn)和收聽中,收聽者被多個揚(yáng)聲器環(huán)繞。存在捕獲針對特定設(shè)置(set-up)的音頻信號的各種方法。再現(xiàn)時的一個通常目標(biāo)是再現(xiàn)原始記錄的聲音事件的空間合成,即各個音頻源的源點(origin),如管弦樂隊內(nèi)喇叭的位置。多個揚(yáng)聲器設(shè)置是相當(dāng)常見的,并且可以產(chǎn)生不同的空間感。不使用特殊的后生產(chǎn)技術(shù),通常已知的兩聲道立體聲設(shè)置可以僅在兩個揚(yáng)聲器之間的線上重建聽覺事件。這主要通過所謂的“振幅-移動(panning)”來實現(xiàn),其中取決于音頻源相對于揚(yáng)聲器的位置,與一個音頻源相關(guān)的信號的振幅分布在兩個揚(yáng)聲器之間。這通常在記錄或后續(xù)的混音期間進(jìn)行。即來自相對于收聽位置較遠(yuǎn)左側(cè)的音頻源將主要通過左揚(yáng)聲器再現(xiàn),而在收聽位置前面的音頻源將通過這兩個揚(yáng)聲器以相同的振幅(電平)再現(xiàn)。然而,不能再現(xiàn)從其他方向發(fā)出的聲音。
因此,通過使用分布在收聽者周圍的更多揚(yáng)聲器,可以覆蓋更多方向,并且可以產(chǎn)生更加自然的空間感。可能最公知的多聲道揚(yáng)聲器布局是5.1標(biāo)準(zhǔn)(ITU-R775-1),其包括5個揚(yáng)聲器,將這些揚(yáng)聲器相對于收聽位置的方位角預(yù)先確定為0°、±30°和±110°。這表示在記錄或混音期間,將信號調(diào)整為特定揚(yáng)聲器配置,而且根據(jù)該標(biāo)準(zhǔn)的再現(xiàn)設(shè)置的偏差將導(dǎo)致再現(xiàn)質(zhì)量降低。
也提出了具有位于不同方向上的不同數(shù)目的揚(yáng)聲器的多個其他系統(tǒng)。專業(yè)和專用系統(tǒng)(尤其在影院和聲音裝置中)也包括不同高度的揚(yáng)聲器。
近年來提出了被稱為DirAC的通用音頻再現(xiàn)系統(tǒng),其能夠記錄并再現(xiàn)針對任意揚(yáng)聲器設(shè)置的聲音。DirAC的目的是使用具有任意幾何設(shè)置的多聲道揚(yáng)聲器系統(tǒng),盡可能精確地再現(xiàn)現(xiàn)有聲學(xué)環(huán)境的空間感。在記錄環(huán)境中,以全向麥克風(fēng)(W)和允許測量聲音到達(dá)方向以及聲音擴(kuò)散的麥克風(fēng)組來測量環(huán)境的響應(yīng)(可以是連續(xù)記錄的聲音或脈沖響應(yīng))。在以下段落中以及在本申請中,術(shù)語“擴(kuò)散”應(yīng)被理解為針對聲音的非方向性測量。即,以相等的強(qiáng)度從所有方向到達(dá)收聽或記錄位置的聲音是最大擴(kuò)散的。量化擴(kuò)散的通常方式是使用來自區(qū)間[0,…,1]的擴(kuò)散值,其中,值1描述了最大擴(kuò)散聲音,而值0描述了理想定向聲音,即僅從一個可清晰辨識的方向發(fā)出的聲音。一個通常已知的測量聲音到達(dá)的方向的方法是應(yīng)用與笛卡爾坐標(biāo)軸對齊的3個八字(figure-of-eight)麥克風(fēng)(XYZ)。已設(shè)計出被稱作“聲場麥克風(fēng)”的專用麥克風(fēng),該麥克風(fēng)直接產(chǎn)生所有期望的響應(yīng)。然而,如以上所提及的,W、X、Y和Z信號也可以根據(jù)離散全向麥克風(fēng)組進(jìn)行計算。
近來,Goodwin和Jot提出了利用伴隨的方向數(shù)據(jù),將任意多個聲道的音頻格式存儲至音頻的一個或兩個下混音聲道的方法。該格式可以應(yīng)用于任意的再現(xiàn)系統(tǒng)。使用“Gerzon矢量(包括速度矢量和能量矢量)”來計算定向數(shù)據(jù)(即,具有與音頻源的方向有關(guān)的信息的數(shù)據(jù))。速度矢量是從收聽位置指向揚(yáng)聲器的矢量的加權(quán)和,其中每個權(quán)重是揚(yáng)聲器的給定時間/頻率瓦(tile)處的頻譜的幅值。能量矢量是類似的加權(quán)矢量和。然而,權(quán)重是揚(yáng)聲器信號的短時能量估計,即其描述了稍微平滑的信號或包含在有限長度時間間隔內(nèi)的信號中的信號能量的積分。具有充分根據(jù)的是,這些矢量共有的缺點是與實際的或感知的量不相關(guān)。例如,沒有適當(dāng)?shù)乜紤]揚(yáng)聲器相對于彼此的相對相位。例如,這表示,如果將寬帶信號饋入相反相位的收聽位置之前的立體聲設(shè)置的揚(yáng)聲器,則收聽者將感知到來自周圍方向的聲音,收聽位置中的聲場將具有從一側(cè)到另一側(cè)(例如,從左側(cè)到右側(cè))的聲音能量振蕩。在這種場景下,Gerzon矢量將會指向前方,顯然這并不表示實際的或感知的情況。
自然地,市場上存在多個多聲道格式或表示,存在能夠在不同表示之間轉(zhuǎn)換的需求,從而可以利用最初針對可選的多聲道表示而開發(fā)的設(shè)置來再現(xiàn)各個表示。即例如,可能需要5.1聲道與7.1或7.2聲道之間的轉(zhuǎn)換,以使用現(xiàn)有的7.1或7.2聲道回放設(shè)置來回放通常在DVD上使用的5.1多聲道表示。多種音頻格式使音頻內(nèi)容生產(chǎn)變得困難,因為所有格式需要特定的混頻和存儲/傳輸格式。因此,用于不同再現(xiàn)設(shè)置上的回放的不同記錄格式之間的轉(zhuǎn)換是必需的。
提出了多種方法將特定音頻格式的音頻轉(zhuǎn)換為另一音頻格式。然而,總是將這些方法調(diào)整為特定多聲道格式或表示。即這些僅可應(yīng)用于從一個特定的預(yù)定多聲道表示至另一特定的多聲道表示的轉(zhuǎn)換。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會,未經(jīng)弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200880009025.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 通過將告警文件轉(zhuǎn)換為較低復(fù)雜度文件格式并使用轉(zhuǎn)換后的告警文件生成告警來存儲告警文件的方法,以及相關(guān)電子裝置和計算機(jī)程序產(chǎn)品
- 用于將具有特定音頻格式的音頻數(shù)據(jù)輸出到音頻輸出裝置的方法,相關(guān)電路及多媒體播放器
- 一種基于音頻格式的文件傳輸方法及系統(tǒng)
- 多播放器共同播放高保真聲音的方法及裝置
- 一種音頻播放中的音頻格式處理方法
- 一種音頻播放中的音頻解碼策略
- 音頻播放設(shè)備、音頻播放方法、設(shè)備及存儲介質(zhì)
- 多通道空間音頻格式輸入信號的處理
- HDMI切換器和HDMI切換系統(tǒng)
- HDMI切換器和HDMI切換系統(tǒng)





