[發(fā)明專利]用于使用基于對象的元數(shù)據(jù)產(chǎn)生音頻輸出信號的裝置和方法有效
| 申請?zhí)枺?/td> | 201310228584.3 | 申請日: | 2009-07-06 |
| 公開(公告)號: | CN103354630A | 公開(公告)日: | 2013-10-16 |
| 發(fā)明(設(shè)計(jì))人: | 斯蒂芬·施賴納;沃爾夫?qū)し茲蔂?/a>;馬蒂亞斯·諾伊辛格;奧立夫·赫爾穆特;拉爾夫·斯皮爾施內(nèi)德 | 申請(專利權(quán))人: | 弗朗霍夫應(yīng)用科學(xué)研究促進(jìn)協(xié)會(huì) |
| 主分類號: | H04S3/00 | 分類號: | H04S3/00 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋融冰 |
| 地址: | 德國*** | 國省代碼: | 德國;DE |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 使用 基于 對象 數(shù)據(jù) 產(chǎn)生 音頻 輸出 信號 裝置 方法 | ||
本申請是申請人為弗朗霍夫應(yīng)用科學(xué)研究促進(jìn)協(xié)會(huì)、申請日為2011年1月17日、申請?zhí)枮?00980127935.3、發(fā)明名稱為“用于使用基于對象的元數(shù)據(jù)產(chǎn)生音頻輸出信號的裝置和方法”的分案申請。
技術(shù)領(lǐng)域
本發(fā)明涉及音頻處理,具體而言,涉及在諸如空間音頻對象編碼的音頻對象編碼方面的音頻處理。
背景技術(shù)
在現(xiàn)今的廣播系統(tǒng)例如電視機(jī)中,在某些情況下,希望不要如同錄音師所設(shè)計(jì)的那樣再現(xiàn)音軌,而希望是執(zhí)行特殊調(diào)整,以解決在演示時(shí)所給予的約束。一種廣為人知的控制此種后期制作調(diào)整的技術(shù),是提供伴隨著那些音軌的適當(dāng)元數(shù)據(jù)。
傳統(tǒng)的還音系統(tǒng),如老式家用電視系統(tǒng),系由一個(gè)揚(yáng)聲器或一對立體揚(yáng)聲器所組成。更先進(jìn)的多聲道再現(xiàn)系統(tǒng)使用五個(gè)或者甚至更多個(gè)揚(yáng)聲器。
若考慮的是多聲道再現(xiàn)系統(tǒng),那么錄音師可更靈活地在二維平面上放置數(shù)個(gè)單音源,并因此亦可針對其所有的音軌而使用較高的動(dòng)態(tài)范圍,因?yàn)橛捎诠碾u尾酒會(huì)效應(yīng)(cocktail?party?effect)實(shí)現(xiàn)語音清晰度容易得多。
然而,那些保真的、高動(dòng)態(tài)的音頻可能會(huì)導(dǎo)致在傳統(tǒng)再現(xiàn)系統(tǒng)上的問題。可能會(huì)有這樣的情景出現(xiàn):顧客可能會(huì)不想要這種高動(dòng)態(tài)信號,因?yàn)樗蛩窃诔臭[的環(huán)境中(如開車時(shí)或是在飛機(jī)上,或是使用移動(dòng)娛樂系統(tǒng))聆聽這些內(nèi)容,她或他正戴著助聽器,或是她或他并不想要打擾她或他的鄰居(例如在深夜的時(shí)候)。
此外,廣播公司面臨這樣的問題,那就是,由于連續(xù)項(xiàng)目的調(diào)整位準(zhǔn)需要不同波峰因數(shù),因而在一個(gè)節(jié)目中的不同項(xiàng)目(如商業(yè)廣告)可能會(huì)位于不同的音量位準(zhǔn)。
在傳統(tǒng)的廣播傳輸鏈中,終端用戶接收已混音軌。在接收者方的任何更進(jìn)一步的操作,都可能只以非常受限的形式完成。目前杜比元數(shù)據(jù)的小特征集(feature?set)允許使用者修改音頻信號的一些特性。
一般而言,根據(jù)上文所提過的元數(shù)據(jù)的操作,是在沒有任何頻率選擇性區(qū)別的情況下應(yīng)用的,因?yàn)閭鹘y(tǒng)上隸屬于音頻信號的元數(shù)據(jù)并未提供足夠的信息來這么做。
此外,只有完整的音頻流本身才可被操作。另外,也沒有任何方法用于在此音頻流中采納并分割各個(gè)音頻對象。特別是在不適當(dāng)?shù)鸟雎牠h(huán)境中,這可能會(huì)令人不滿。
在午夜模式中,因?yàn)槭チ藢?dǎo)引信息,所以現(xiàn)存的音頻處理器不可能區(qū)分環(huán)境噪聲與對話。因此,在高位準(zhǔn)噪聲(其必須在音量上被壓縮或限制)的情況中,對話也將會(huì)被平行地操作。這可能會(huì)損害語音清晰度。
相對于環(huán)境聲音而增加對話位準(zhǔn),有助于增進(jìn)對語音的感知,特別是對于聽力障礙者。這樣的技術(shù)只在當(dāng)音頻信號額外配合特性控制信息,而在對話與環(huán)境分量真正分離時(shí),才能發(fā)揮作用。若只有立體聲降混信號是可用的,那么就再也不能施加進(jìn)一步的分離以分別區(qū)分和操作語音信息。
目前的降混解決辦法允許針對中央與環(huán)繞聲道的動(dòng)態(tài)立體聲位準(zhǔn)調(diào)整。但針對取代立體聲音響的任何變型的揚(yáng)聲器配置,并沒有來自發(fā)送器的如何降混最終多聲道音頻源的真正描述。只有解碼器中的默認(rèn)公式以非常不靈活的方式執(zhí)行信號混合。
在所有描述的方案中,通常會(huì)存在著兩種不同的途徑。第一個(gè)途徑是,當(dāng)產(chǎn)生要發(fā)送的音頻信號時(shí),將一組音頻對象降混進(jìn)單聲道、立體聲、或是多聲道信號中。要經(jīng)由廣播、任何其它傳輸協(xié)議、或在計(jì)算機(jī)可讀儲存介質(zhì)上發(fā)布而發(fā)送給用戶此信號的的這個(gè)信號,一般會(huì)具有小于原始音頻對象數(shù)目的聲道數(shù),這些原始音頻對象被音響師在例如工作室環(huán)境中降混。此外,可附加元數(shù)據(jù),以允許數(shù)種不同的修改,但這些修改只可應(yīng)用在完整的發(fā)送信號上,或者是,若所發(fā)送的信號具有數(shù)個(gè)不同的發(fā)送聲道時(shí),整體地應(yīng)用在獨(dú)立的一些發(fā)送聲道上。然而,由于這些發(fā)送聲道總是數(shù)個(gè)音頻對象的疊加,因而在其他音頻對象未被操作的情況下,對于特定音頻對象的獨(dú)立操作是完全不可能的。
另一個(gè)途徑是不執(zhí)行對象降混,而在其作為分離的發(fā)送聲道時(shí)發(fā)送音頻對象信號。如果音頻對象的數(shù)目很小,則這樣的方案可很好地發(fā)揮作用。例如當(dāng)只存在五個(gè)音頻對象時(shí),就有可能在5.1方案中彼此分離地發(fā)送這五個(gè)相異的音頻對象。元數(shù)據(jù)可與這些聲道相關(guān)聯(lián),其指出對象/聲道的專有性質(zhì)。然后,在接收器側(cè),能夠基于所發(fā)送的元數(shù)據(jù)來操作這些所發(fā)送的聲道。
此途徑的缺點(diǎn)是,其并非反向兼容的,且只在小量音頻對象的情況中運(yùn)作良好。當(dāng)音頻對象的數(shù)目增加時(shí),作為分離的明確音軌發(fā)送所有對象的所需比特率急劇上升。此上升的比特率在廣播應(yīng)用的情況中是特別不適宜的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于弗朗霍夫應(yīng)用科學(xué)研究促進(jìn)協(xié)會(huì),未經(jīng)弗朗霍夫應(yīng)用科學(xué)研究促進(jìn)協(xié)會(huì)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310228584.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





