[發明專利]對語音和/或非語音音頻輸入信號編碼或解碼的方法和設備有效
| 申請號: | 200910150302.6 | 申請日: | 2009-06-19 |
| 公開(公告)號: | CN101615393A | 公開(公告)日: | 2009-12-30 |
| 發明(設計)人: | 奧利弗·威伯特;約翰尼斯·伯姆 | 申請(專利權)人: | 湯姆森許可貿易公司 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;H03M7/30;G11B7/24 |
| 代理公司: | 中科專利商標代理有限責任公司 | 代理人: | 戎志敏 |
| 地址: | 法國布洛涅*** | 國省代碼: | 法國;FR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 音頻 輸入 信號 編碼 解碼 方法 設備 | ||
技術領域
本發明涉及對語音和/或非語音音頻輸入信號進行編碼或解碼的 方法和設備。
背景技術
已知多種寬帶或者語音/音頻編解碼,例如:
S.Ragor等人的“ITU-T?G.729.1:An?8-32?Kbit/s?scalable?coder interoperable?with?G.729?for?wideband?telephony?and?voice?over?IP”, IEEE?International?Conference?on?Acoustics,Speech?and?Signal Processing?2007,ICASSP?2007,vol.4,pp.IV-529至IV-532。該寬帶語音 編碼器包括被永久性地使用的嵌入式G.729語音編碼器。因此,類似 音樂的信號(非語音)的質量不是很好。盡管該編碼器使用了變換編 碼技術,但是其是語音編碼器。
S.A.Ramprashad的“A?two?stage?hybrid?embedded?speech/audio coding?structure”,Proceedings?of?the?1998?IEEE?International?Conference on?Acoustics,Speech,and?Signal?Processing?1998,ICASSP?1998,vol.1, pp.337-340。該編碼器使用了類似于上述編碼器的原理結構。該處理 是基于時間域信號的,這意味著難以處理核心編碼器/解碼器(語音編 碼器)中的延遲。為了抑制該問題,該處理是基于普通變換的。同樣, 永久性地使用該核心編碼器(即,語音編碼器),這造成了針對類似音 樂(非語音)信號的非最優質量。
M.Purat,P.Noll的“A?new?orthonormal?wavelet?packet decomposition?for?audio?coding?using?frequency-varying?modulated lapped?transforms”,IEEE?ASSP?Workshop?on?Applications?of?Signal Processing?to?Audio?and?Acoustics,1995,pp.183-186。
M.Purat,P.Noll的“Audio?coding?with?a?dynamic?wavelet?packet decomposition?based?on?frequency-varying?modulated?lapped?transforms”, IEEE?International?Conference?on?Acoustics,Speech,and?Signal Processing?1996,ICASSP?1996,vol.2,pp.1021-1024。
發明內容
已知音頻/語音編解碼的不足之處在于編碼質量對內容類型的明 顯依賴性,即,類似音樂的音頻信號最好由音頻編解碼器來編碼,而 類似語音的音頻信號最好由語音編解碼器來編碼。沒有任何已知編解 碼針對混合的語音/音樂內容掌握著主導地位。
本發明要解決的問題是提供一種針對語音和音樂二者而言的良好 編解碼性能,并且進一步提高針對此類混合信號的編解碼性能。該問 題由權利要求1和3中披露的方法所解決。使用了這些方法的設備在 權利要求2和4中披露。
本發明的聯合語音/音頻編解碼使用了語音編碼技術以及音頻變 換編碼技術。通過在編解碼輸入處使用一個或者更多調制重疊變換 (Modulated?Lapped?Transform),并且在編解碼輸出處使用一個或者 更多調制重疊逆變換(IMLT),以有利的方式將已知的基于變換的音 頻編碼處理與基于線性預測的語音編碼處理相結合。MLT輸出頻譜被 劃分為分配給編解碼的語音編碼部分的頻率箱(低頻率),以及分配給 編解碼的基于變換的編碼部分的剩余頻率箱(高頻率),其中,在編解 碼輸入和輸出處的變換長度可以是以信號適應性的方式切換的。
作為備選,在基于變換的編碼/解碼部分中,變換長度可以是以輸 入信號適應性的方式切換的。
本發明實現了針對類似語音和類似音樂的音頻信號二者的統一、 優良的編解碼質量,特別是既針對非常低的比特率,也針對較高的比 特率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湯姆森許可貿易公司,未經湯姆森許可貿易公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910150302.6/2.html,轉載請聲明來源鉆瓜專利網。





