[發(fā)明專利]一種帶寬擴展方法及其裝置無效
| 申請?zhí)枺?/td> | 200910089156.0 | 申請日: | 2009-07-31 |
| 公開(公告)號: | CN101990253A | 公開(公告)日: | 2011-03-23 |
| 發(fā)明(設計)人: | 閆建新;王磊 | 申請(專利權)人: | 數(shù)維科技(北京)有限公司 |
| 主分類號: | H04W28/16 | 分類號: | H04W28/16;H04B7/26 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100086 北京市海淀區(qū)中關村*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 帶寬 擴展 方法 及其 裝置 | ||
技術領域
本發(fā)明涉及一種新的帶寬擴展方法及其裝置,更具體地,涉及一種基于非等帶寬增益的帶寬擴展方法及其裝置。
背景技術
在編碼條件受限的條件下,例如碼率受限的通信環(huán)境或安全防范監(jiān)控環(huán)境中,僅僅采用通常的語音或音頻編碼方法往往難于獲得令人滿意的編碼效果。此時,需要更多地考慮人耳的聽覺特性以進一步降低碼率:例如,早期碼率受限的編碼方法中將更多的比特分配給音頻或語音信號的低頻部分,而對信號的高頻部分少分配甚至不分配比特。這種簡單放棄或部分放棄高頻部分的編碼方法使編碼碼率達到了目標碼率的要求,但解碼后的音頻信號質量可能會明顯下降。
帶寬擴展BWE(Band?Width?Extension)技術是對前述放棄高頻思想的一種改進技術:它通過在編碼端選取適當?shù)膮?shù)加以編碼,然后在解碼端利用這些參數(shù),將低頻解碼后的頻帶較窄的信號“擴展”到頻帶范圍更加寬廣的范圍。目前,BWE技術被廣泛使用在低碼率音頻或語音(例如AMR-WB+)編碼應用中。
作為BWE技術的應用實例,在圖1描述了一種典型的包含BWE技術的數(shù)字音頻編碼裝置10,其包括了接收輸入PCM數(shù)據(jù)的預處理模塊12、分別連接到預處理模塊12的低頻編碼核14、帶寬擴展處理模塊16、以及將低頻編碼核14的輸出和帶寬擴展處理模塊16的輸出打包的數(shù)據(jù)打包模塊18。與音頻編碼系統(tǒng)10相對應的音頻解碼裝置在本文中并未示出,但本領域技術人員通過閱讀說明書能夠理解,該音頻解碼裝置是這樣的裝置:根據(jù)所接收的編碼數(shù)據(jù)中的邊信息,逆向執(zhí)行音頻編碼系統(tǒng)10處理數(shù)據(jù)時的各個步驟,最終在解碼端恢復出編碼前的PCM數(shù)據(jù)。下面結合圖1,詳細說明音頻編碼系統(tǒng)10中的各模塊的工作原理:
●預處理模塊12的作用有兩大方面:首先,該模塊判定送入的PCM音頻數(shù)據(jù)屬于環(huán)境類信號還是語音類信號;其次,該模塊通過時域的處理將一個個PCM數(shù)據(jù)超幀分割為高頻時域信號和低頻時域信號(將在下文中詳細描述)。
●低頻編碼核14接收來自預處理模塊的低頻時域信號,在時域或變換域(如,頻域)進行壓縮編碼(根據(jù)預處理模塊12判定的結果,選用的壓縮編碼方法可能不同,典型的如AMR-WB+中提到的ACELP、TCX等);將低頻編碼數(shù)據(jù)發(fā)送給數(shù)據(jù)打包模塊18。
預處理模塊12中判定環(huán)境類信號和語音類信號的方法優(yōu)選是現(xiàn)有技術中現(xiàn)有技術中用于區(qū)分音樂信號(環(huán)境類信號具有音樂信號的特點)和語音信號的方法,由于這部分內容并非本發(fā)明所關注的內容,因此不再詳述。
●帶寬擴展處理模塊16接收來自預處理模塊的低頻時域信號和高頻時域信號,并對它們進行帶寬擴展處理,最終向數(shù)據(jù)打包模塊18輸出用于重建信號高頻部分的高頻BWE參數(shù)。
●數(shù)據(jù)打包模塊18接收低頻編碼數(shù)據(jù)和高頻BWE參數(shù)以及其它邊信息(未示出),并將它們打包成適于傳輸?shù)母袷?,發(fā)往解碼端。
在示例性地說明現(xiàn)有技術中的帶寬擴展技術之前,首先結合圖2簡要描述預處理模塊12中用于將輸入的PCM信號分為高頻時域信號和低頻時域信號的方法。
如圖2所示(以一個超幀的PCM信號為例),由于原始音頻信號的輸入采樣頻率可能是16kHz、24kHz、32kHz和48kHz之一,需要將各種不同采樣頻率的輸入信號在編碼之前的預處理中進行重采樣,轉換為內部采樣頻率Fs(kHz)的信號。同理,在解碼之后的后處理部分同樣需要采樣率轉換。
隨后,將上述采樣率為FS的、共L個PCM信號分別送入截至頻率為FS/4的低通濾波器124和截至頻率為FS/4的高通濾波器122進行濾波;然后再經(jīng)由降采樣裝置126、128,將得到的信號分別作一個2倍臨界降采樣,分別得到Fs/2采樣低頻信號xL(n)和Fs/2采樣高頻信號xH(n),下標L和H代表低頻和高頻,數(shù)字L表示一個音頻超幀中樣本的個數(shù)(即,長度),優(yōu)選為512、1024或2048(降采樣前的數(shù)目),具體長度由級別參數(shù)決定。與之相應的,一個音頻幀的長度一般固定為512個樣本(降采樣前的數(shù)目),本文中所稱的“音頻幀”為進行環(huán)境類或語音類編碼的最小單位。
需要注意的是,圖2僅僅示出了預處理模塊12中與時域分割有關的一個示例,而用于判斷信號類型的裝置并未示出,添加了判斷類型功能的預處理模塊12’(未示出)對于本領域技術人員是顯而易見的。
下面結合幾篇中國專利,對現(xiàn)有技術中的BWE技術進行說明?,F(xiàn)有技術中提出了多個應用BWE技術或改進BWE技術的技術方案:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于數(shù)維科技(北京)有限公司,未經(jīng)數(shù)維科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910089156.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





