[發(fā)明專利]包括幅度包絡的參數(shù)音頻編碼無效
| 申請?zhí)枺?/td> | 200580037709.8 | 申請日: | 2005-10-28 |
| 公開(公告)號: | CN101053018A | 公開(公告)日: | 2007-10-10 |
| 發(fā)明(設計)人: | M·G·克里斯坦森;S·L·J·D·E·范德帕爾 | 申請(專利權)人: | 皇家飛利浦電子股份有限公司 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L19/08 |
| 代理公司: | 中國專利代理(香港)有限公司 | 代理人: | 程天正;劉紅 |
| 地址: | 荷蘭艾*** | 國省代碼: | 荷蘭;NL |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 包括 幅度 包絡 參數(shù) 音頻 編碼 | ||
技術領域
本發(fā)明涉及高質量低比特率音頻信號編碼領域。本發(fā)明尤其涉及基于參數(shù)編碼且用于有效編碼以及瞬態(tài)聲的情況下的高聲音質量的音頻編碼。更具體地,本發(fā)明涉及基于幅度調制的和恒定幅度正弦曲線的組合編碼。
背景技術
音頻編碼中的典型問題是前回音失真,即錯誤發(fā)生在開始(onset)之前。與存在掩碼(marsker)時的情形相比較,這些錯誤非常不易被人類的聽覺系統(tǒng)掩蔽。因此,量化錯誤發(fā)生在瞬態(tài)前很可能引起明顯的聽覺失真。因此,對于合適地編碼瞬態(tài)聲,必須特別關注。
可以測量預掩蔽,通常其持續(xù)僅僅大約20ms,而滯后掩蔽可以持續(xù)長于100ms。另外,應注意的是該掩蔽現(xiàn)象基于臨界頻帶發(fā)生,即它們基于寬帶無法被精確地處理。許多音頻編碼技術,如正弦編碼器,用10-20ms的駐波分量為音頻信號建模。然后,需要許多分量為短的持續(xù)時間瞬態(tài)建模。
在參數(shù)音頻建模及編碼內,幅度調制的正弦模型是捕捉瞬態(tài)聲的特征(例如在″鐘樂器(Glockenspiel)″和″響板(Castanets)″摘錄中遇到的特征)所關注的。例如,在音頻建模的情景下為此目的減幅正弦波已受到一些關注。
在音頻編碼中使用幅度調制的現(xiàn)有技術解決方案的例子是B.Edler,H.Purnhagen和C.Ferekidis的″Analysis/Synthesis?Audio?Codecfor?Very?Low?Bit?Rates″(100th?Conv.Audio?Eng.Soc.preprint4179,1996)以及Schuijers,Oomen,den?Brinker和Gerrits的″Advances?in?parametric?coding?for?high-quality?audion″(Proc.1st?IEEE?Benelux?Workshop?on?Model?Based?Processing?and?Codingof?Audio(MPCA-2002))。然而,這些在其瞬態(tài)的定義、檢測及編碼中都是單波帶的,意思是包絡對所有分量來說都是相同的。不過,在″Analysis/Synthesis?Audio?Codec?for?Very?Low?Bit?Rates″中,對于每個分量都要判定是否要應用一個被估計的包絡。
所提到的現(xiàn)有技術的例子都存在著如下缺點:幅度調制信號的窗口長度或估計可以由強駐波低頻分量占主導,而較弱的瞬態(tài)出現(xiàn)在高頻處,因此引起聽覺假象。另一缺點是:因存在高頻瞬態(tài)的原因而要挑選短的窗口長度,因此導致頻率分辨率很差,以致于降低駐波低頻信號部分的聽覺質量。
發(fā)明內容
可以看到本發(fā)明的目的是提供一種幅度調制正弦音頻編碼器,它在速率失真方面是高效的,意思是,在給定比特率的情況下,與傳統(tǒng)的正弦編碼器相比較,它實現(xiàn)了更低的失真,而且它在復雜性方面也是高效的,且同時它能夠處理瞬態(tài)聲音而沒有嚴重的聽覺假象。
根據(jù)本發(fā)明的第一方面,該目的通過提供一種適于對音頻信號編碼的音頻編碼器來實現(xiàn),該音頻編碼器包括:
-正弦類型編碼器,適于產(chǎn)生第一編碼信號部分,該部分包括第一多個正弦分量,以及
-幅度調制編碼器,適于產(chǎn)生第二編碼信號部分,該部分包括第二多個正弦分量,所述第二多個正弦分量被單獨分配有與時變幅度包絡有關的至少一個參數(shù),
其中該音頻編碼器包括適于相對于預定的編碼效率標準評價第一與第二編碼信號部分并響應其而產(chǎn)生編碼的輸出信號的裝置。
根據(jù)本發(fā)明的第一方面的編碼器還對瞬態(tài)音頻信號提供高編碼效率。原因是幅度調制編碼器適于向每個單獨的正弦分量分配幅度包絡參數(shù),優(yōu)選地每個單獨的正弦分量還在一個段內。因此,所述音頻編碼器能夠精確地表示瞬態(tài)音頻信號,原因在于它可以使一些正弦分量隨時間相當大地變化,而其它的正弦分量可以是恒定的或者差不多是恒定的。據(jù)此,瞬態(tài)信號可以以一種方式來代表,使得可以避免或者至少相當大地減少明顯的聽覺前回音效應。這是優(yōu)于現(xiàn)有技術編碼器的一個優(yōu)點。
根據(jù)本發(fā)明的第一方面的編碼器也是高效的,原因在于音頻輸入信號的編碼效率是相對于正弦類型編碼器和幅度調制編碼器而評價的,優(yōu)選地,正弦類型編碼器是傳統(tǒng)的恒定幅度類型編碼器。因此,在就一些預定的編碼效率標準已評價是高效的時候,僅僅使用代表與每個正弦分量的時變幅度包絡有關的參數(shù)的額外比特率。優(yōu)選地,效率標準包括感知相關的失真測量。在優(yōu)選的實施例中,所述效率標準包括總體比特率與感知失真測量的組合。使用感知失真測量,所感知的聲音質量可以在判定幅度調制參數(shù)是否應被包含于編碼的輸出信號中予以考慮。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于皇家飛利浦電子股份有限公司,未經(jīng)皇家飛利浦電子股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200580037709.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:輕擊棒型球棒頭
- 下一篇:用于傳送幅料的紅外線干燥設備





