[發(fā)明專利]一種量化噪聲泄漏控制方法及裝置有效
| 申請?zhí)枺?/td> | 200810056312.9 | 申請日: | 2008-01-16 |
| 公開(公告)號: | CN101488344A | 公開(公告)日: | 2009-07-22 |
| 發(fā)明(設計)人: | 張德明;張琦 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G06F17/14 |
| 代理公司: | 北京凱特來知識產(chǎn)權代理有限公司 | 代理人: | 鄭立明 |
| 地址: | 518129廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 量化 噪聲 泄漏 控制 方法 裝置 | ||
技術領域
本發(fā)明涉及通信技術領域,尤其涉及一種量化噪聲泄漏控制方法及裝置。
背景技術
在音頻以及寬帶、超寬帶語音編解碼中,以MDCT(Modified?DiscreteCosine?Transform,修正的離散余弦變換)等為基礎的變換域編碼具有很好的能量壓縮及頻率分辨性能,因此得到了廣泛運用。其核心思想是將一定長度的信號通過某種變換變換到變換域,然后根據(jù)特定的量化策略對變換域的系數(shù)進行量化編碼。由于人耳聽覺中存在著掩蔽效應,因此考慮量化策略的時候可以利用這一特性,當信號能量較大時允許有較大的量化誤差。
對于音頻或語音信號來說,經(jīng)常存在這樣的場景:信號從相對很小的能量突然過渡到很大的能量,這會導致基于MDCT等的變換編解碼器出現(xiàn)預回聲(pre-echo)效應,即后一較大能量的幀的量化誤差在解碼端通過MDCT的重疊相加泄露到了前面能量相對較小的幀中。如圖1a所示為未編碼的信號示意圖;圖1b為變換編碼后的信號示意圖。一般這種Pre-Echo超過2毫秒的人耳前掩蔽時間就會被人耳察覺。相應的也會有Post-Echo(后回聲)效應,然而Post-Echo一般會被長達幾十毫秒的人耳后掩蔽效應掩蓋。所以在語音音頻編解碼中通常需要關注的是Pre-Echo效應。
現(xiàn)有技術一解決上述技術問題的技術方案為:窗長切換技術
窗長切換技術是基于MDCT變換的算法解決由預回聲引起的量化噪聲泄漏的典型算法,在MPEG、PAC、ATARC(Adaptive?Transform?AcousticCoding,自適應音頻變換編碼)中都采用了這種技術。在信號比較平穩(wěn)的時?候采用較長的分析窗,在信號突然出現(xiàn)瞬態(tài)信號的時候采用較短的分析窗。針對不同的信號特性采用不同的分析窗長主要有兩個優(yōu)點:首先,對瞬態(tài)信號采用較短的分析窗可以減小量化噪聲在時域上的泄漏,同時也可以由這個瞬態(tài)信號產(chǎn)生的掩蔽效應使得泄漏的噪聲對聽覺不產(chǎn)生影響;其次采用較短的分析窗可以將瞬態(tài)信號所需的較多的比特數(shù)限制在最短的時間范圍內。本方案中判斷是否產(chǎn)生瞬態(tài)信號主要通過計算感知熵(PE)這一參數(shù)進行判斷。
在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術一至少存在如下缺點:
由于采用了長度不同的分析窗,所以編碼器中的感知模型和無損編碼部分都需要支持多種時間分辨率;其次在采用較短的分析窗時,頻域分辨率會很低,編碼效率降低;而且分析窗的切換本身就會給編碼器帶來更多的時延。感知熵的計算過程非常復雜,而且存在著較多的誤判,會導致錯誤的窗切換。
與本發(fā)明相關的現(xiàn)有技術二的技術方案為:時域噪聲整形技術
如果某個信號在時域是一個脈沖,那么它在頻域則是一個可預測的周期性信號,可以在頻域通過LPC(Linear?Prediction?Coding,線形預測編碼)來得到較大的編碼增益。TNS(Temporal?Noise?Shaping,時域噪聲整形)就是基于這一想法在頻域對每一幀輸入信號的頻譜進行LPC分析,當LPC的預測增益大于一定門限的時候,即認為出現(xiàn)了瞬態(tài)信號,然后對LPC分析之后的殘差信號進行基于感知編碼原則的編碼,將LPC分析得到合成濾波器系數(shù)作為邊信號進行傳輸;否則就認為沒有檢測到瞬態(tài)信號,按照正常狀態(tài)編碼。
在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術二至少存在如下缺點:
利用TNS進行瞬態(tài)信號檢測的準確率較低,會出現(xiàn)很多誤判,由此會導致整個編碼效率的降低。
綜上所述,現(xiàn)有技術解決預回聲引起的量化噪聲在時域泄漏問題的方法存在如下諸多問題:計算復雜度高、時延較大、編碼效率不高、占用系統(tǒng)資源較多、準確率低等。
發(fā)明內容
本發(fā)明實施例提供一種量化噪聲泄漏控制方法及裝置,具有低時延、低復雜度、高效準確等特性。
本發(fā)明實施例是通過以下技術方案實現(xiàn)的:
本發(fā)明實施例提供一種編碼裝置,用于對音頻信號編碼,包括:瞬態(tài)信號檢測單元及選擇控制單元;
所述瞬態(tài)信號檢測單元,用于對當前輸入的一幀信號進行瞬態(tài)分析,檢測是否出現(xiàn)瞬態(tài)信號,并發(fā)送瞬態(tài)信號檢測結果;所述瞬態(tài)信號檢測單元進一步包括:
最大幅值計算子單元,用于將一幀信號分為多個子幀,計算每個子幀的最大幅度值;
瞬態(tài)檢測函數(shù)計算子單元,計算每個子幀的最大幅度值與該子幀相鄰前幾個子幀的最大幅度值之和的比值,得到瞬態(tài)檢測函數(shù);
檢測子單元,用于判斷所述比值是否大于一定閾值,如果比值大于一定的閾值,則認為檢測到了瞬態(tài)信號,否則就認為沒有檢測到瞬態(tài)信號;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經(jīng)華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810056312.9/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:BCH碼控制器接口電路
- 下一篇:一種寬帶語音編碼器及方法





