[發(fā)明專利]用于編碼的音頻編碼器及用于解碼的音頻解碼器在審
| 申請?zhí)枺?/td> | 202110019014.8 | 申請日: | 2016-03-07 |
| 公開(公告)號: | CN112614496A | 公開(公告)日: | 2021-04-06 |
| 發(fā)明(設計)人: | 薩沙·迪施;紀堯姆·??怂?/a>;伊曼紐爾·拉韋利;克里斯蒂安·諾伊卡姆;康斯坦丁·施密特;康拉德·本多爾夫;安德烈·尼德邁爾;本杰明·舒伯特;拉爾夫·蓋革 | 申請(專利權)人: | 弗勞恩霍夫應用研究促進協(xié)會 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/02;G10L19/04;G10L19/18;G10L21/038 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 德國*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 編碼 音頻 編碼器 解碼 解碼器 | ||
展示用于編碼多聲道音頻信號(4)的音頻編碼器(2)的示意性框圖。音頻編碼器包括線性預測域編碼器(6)、頻域編碼器(8)以及用于在線性預測域編碼器(6)與頻域編碼器(8)之間切換的控制器(10)??刂破鞅慌渲脼槭沟枚嗦暤佬盘柕牟糠钟删€性預測域編碼器的編碼幀表示或由頻域編碼器的編碼幀表示。線性預測域編碼器包括用于對多聲道信號(4)進行降混以獲得降混信號(14)的降混頻器(12)。線性預測域編碼器還包括用于編碼降混信號的線性預測域核心編碼器(16),此外,線性預測域編碼器包括用于從多聲道信號(4)生成第一多聲道信息(20)的第一聯(lián)合多聲道編碼器(18)。
本申請是申請日為2016年03月07日提交的名為“用于編碼的音頻編碼器及用于解碼的音頻解碼器”的中國發(fā)明專利申請201680014669.3的分案申請。其母案的相關申請作為參考并入本文中。
技術領域
本發(fā)明涉及一種用于編碼多聲道音頻信號的音頻編碼器及用于解碼經編碼的音頻信號的音頻解碼器。實施例涉及包括波形保持及參數(shù)化立體聲編碼的切換式感知音頻編解碼器。
背景技術
音頻信號的感知編碼出于用于此等信號的高效存儲或傳輸?shù)臄?shù)據(jù)縮減的目的而被廣泛實際應用。特別地,當將達到最高效率時,使用緊密適合于信號輸入特性的編解碼器。一個示例為MPEG-D USAC核心編解碼器,其可用于主要對語音信號使用代數(shù)碼本激勵線性預測(ACELP,Algebraic Code-Excited Linear Prediction)編碼、對背景噪聲及混合信號使用變換編碼激勵(TCX,Transform Coded Excitation)以及對音樂內容使用高級音頻編碼(AAC,Advanced Audio Coding)。所有的三個內部編解碼器配置可響應于信號內容以信號自適應方式被立即切換。
此外,使用聯(lián)合多聲道編碼技術(中間/側編碼等)或為了最高效率而使用參數(shù)化編碼技術。參數(shù)化編碼技術基本上以感知等同音頻信號的再造而非給定波形的忠實重建為目標。示例包括噪聲填充、帶寬擴展以及空間音頻編碼。
在現(xiàn)有技術水平的編解碼器中,當將信號自適應核心編碼器與聯(lián)合多聲道編碼或參數(shù)化編碼技術進行組合時,核心編解碼器被切換以匹配信號特性,但多聲道編碼技術(如,M/S立體聲、空間音頻編碼或參數(shù)化立體聲)的選擇保持固定且獨立于信號特性。這些技術通常被用于核心編解碼器以作為核心編碼器的預處理器及核心解碼器的后處理器,這兩種處理器不知道核心編解碼器的實際選擇。
另一方面,用于帶寬擴展的參數(shù)化編碼技術的選擇有時是信號相依地做出的。舉例而言,應用于時域中的技術對于語音信號更有效率,而頻域處理對于其他信號更相關。在此情況下,所采用的多聲道編碼技術必須與兩種帶寬擴展技術兼容。
現(xiàn)有技術水平中的相關話題包括:
作為MPEG-D USAC核心編解碼器的預處理器/后處理器的PS及MPS
MPEG-D USAC標準
MPEG-H 3D音頻標準
在MPEG-D USAC中,描述了可切換核心編碼器。然而,在USAC中,多聲道編碼技術被定義為整個核心編碼器常見的固定選擇,與其編碼原理的內部切換為ACELP或TCX(“LPD”)或AAC(“FD”)無關。因此,若期望切換式核心編解碼器配置,編解碼器被限制為針對整個信號始終使用參數(shù)化多聲道編碼(parametric multichannel coding,PS)。然而,為了編碼(例如)音樂信號,使用聯(lián)合立體聲編碼將更恰當,其可每頻帶及每幀地在L/R(左/右)與M/S(中間/側)方案之間動態(tài)地切換。
因此,需要經改良的方法。
發(fā)明內容
本發(fā)明的目標為提供用于處理音頻信號的經改良的概念。通過獨立權利要求的主題實現(xiàn)此目標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于弗勞恩霍夫應用研究促進協(xié)會,未經弗勞恩霍夫應用研究促進協(xié)會許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110019014.8/2.html,轉載請聲明來源鉆瓜專利網。





