[發明專利]用于在空間音頻對象編碼中適配音頻信息的設備和方法有效
| 申請號: | 201380042080.0 | 申請日: | 2013-06-28 |
| 公開(公告)號: | CN104704557B | 公開(公告)日: | 2017-08-29 |
| 發明(設計)人: | 托爾斯滕·卡斯特納;于爾根·赫勒;萊昂·特倫提夫;奧利弗·赫爾穆特;約尼·保盧斯;法爾科·里德布施 | 申請(專利權)人: | 弗勞恩霍夫應用研究促進協會 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/16 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 唐京橋,李春暉 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 空間 音頻 對象 編碼 配音 信息 設備 方法 | ||
技術領域
本發明涉及音頻信號解碼和音頻信號處理,更具體地,涉及用于在空間音頻對象編碼(SAOC)中將音頻信息進行適配的解碼器和方法。
背景技術
US2011200197A1提供了一種能夠有效地處理基于對象的音頻信號的音頻解碼方法和裝置以及音頻編碼方法和裝置。音頻解碼方法包括:接收縮混信號和基于對象的輔助信息,所述縮混信號包括至少兩個縮混聲道信號;從所述基于對象的輔助信息提取增益信息,并且基于所述增益信息生成基于聲道對聲道修改所述縮混聲道信號的修改信息;以及通過將所述修改信息應用于縮混聲道信號來修改所述縮混聲道信號。
在現代數字音頻系統中,允許在接收方側對所傳輸的內容進行與音頻對象相關的修改是主要趨勢。這些修改包括對在經由空間分布的揚聲器進行多聲道回放的情況下對專用音頻對象的空間重定位和/或音頻信號的所選擇的部分的增益修改。這可以通過單獨地將音頻內容的不同部分遞送到不同的揚聲器來實現。
換言之,在音頻處理、音頻傳輸以及音頻存儲領域中,越來越期望允許對面向對象的音頻內容回放進行用戶交互,并且還需要利用多聲道回放的擴展的可能性以單獨地呈現音頻內容或者部分音頻內容,以便改進聽覺感受。由此,多聲道音頻內容的使用為用戶帶來顯著的改進。例如,可以獲得三維聽覺感受,這在娛樂應用中帶來改進的用戶滿意度。然而,多聲道音頻內容在專業環境中例如電話會議應用中也是有用的,因為可以通過使用多聲道音頻回放來改進講話者清晰度。另一可能的應用是給音樂作品的聽者提供不同部分(也稱為“音頻對象”)或音軌如人聲部分或者不同樂器的單獨調整回放級別和/或空間位置。用戶可以為了個人品味、為了從音樂作品中更容易地改編一個或更多個部分、為了教學目的、卡拉OK、排練等原因而進行這種調整。
對如以脈沖編碼調制(PCM)數據或者甚至是壓縮音頻格式的形式的全數字多聲道或多對象音頻內容的直接的分離傳輸要求非常高的比特率。然而,以高比特率效率的方式來傳輸和存儲音頻數據也是理想的。因此,為了避免由多聲道/多對象應用導致的過度資源負荷,人們樂于在音頻質量與比特率要求之間接受合理的折衷。
近來,在音頻編碼領域中,由如運動圖像專家組(MPEG)等提出了用于對多聲道/多對象音頻信號的比特率效率的傳輸/存儲的參數化技術。一個示例是作為面向聲道的方法[MPS、BCC]的MPEG環繞聲(MPS),或者作為面向對象的方法[JSC、SAOC、SAOC1、SAOC2]的MPEG空間音頻對象編碼(SAOC)。另一種面向對象的方法稱為“通知源分離”[ISS1、ISS2、ISS3、ISS4、ISS5、ISS6]。這些技術旨在音頻場景中基于對聲道/對象以及附加的輔助信息的縮混來重現期望的輸出音頻場景或者期望的音頻源對象,其中輔助信息描述所傳輸的/存儲的音頻場景和/或音頻源對象。
對這樣的系統中的與聲道/對象相關的輔助信息的估計和應用以時間-頻率選擇方式來完成。因此,這樣的系統采用時間-頻率變換如離散傅里葉變換(DFT)、短時傅里葉變換(STFT)或者濾波器組如正交鏡像濾波器(QMF)組等。在圖3中,使用MPEG SAOC為例來描繪這樣的系統的基本原理。
在STFT的情況下,時間維度由時間塊編號來表示,而頻譜維度由頻譜系數(“格子(bin)”)的編號來獲得。在QMF的情況下,時間維度由時隙編號來表示,而頻譜維度由子頻帶編號來獲得。如果QMF的頻譜分辨率由隨后應用第二濾波器階段來改進,則整個濾波器組稱為混合QMF,并且高分辨率子頻帶稱為混合子頻帶。
如上所述,如圖3所示,在SAOC中,通常以時間-頻率選擇方式來進行處理,并且在每個頻帶內可以被描述如下:
-使用由元素d1,1…dN,P構成的縮混矩陣將N個輸入音頻對象信號s1…sN混縮成P個聲道x1…xP以作為編碼器處理的一部分,另外,編碼器對描述輸入音頻對象的特性的輔助信息(輔助信息估計器(SIE)模塊)進行提取。對于MPEG SAOC,關于彼此的對象能量的關系是這種輔助信息的最基本的形式。
-一個或更多個縮混信號和輔助信息被傳輸/存儲。為此,可以如使用眾所周知的感知音頻編碼器如MPEG-l/2Layer II或者III(aka.mp3)、MPEG-2/4增強音頻編碼(AAC)等來將一個或更多個縮混音頻信號進行壓縮。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于弗勞恩霍夫應用研究促進協會,未經弗勞恩霍夫應用研究促進協會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380042080.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于機動車輛的照明裝置和相關的組裝方法
- 下一篇:一種太陽能路燈





