[發(fā)明專(zhuān)利]用于知覺(jué)音頻編碼的信號(hào)處理方法及其柔性濾波器無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 01134558.6 | 申請(qǐng)日: | 2001-11-02 |
| 公開(kāi)(公告)號(hào): | CN1357877A | 公開(kāi)(公告)日: | 2002-07-10 |
| 發(fā)明(設(shè)計(jì))人: | 陳常謙 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京阜國(guó)數(shù)字技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G10L19/00 | 分類(lèi)號(hào): | G10L19/00;//G10L101023 |
| 代理公司: | 中科專(zhuān)利商標(biāo)代理有限責(zé)任公司 | 代理人: | 朱黎光,張占榜 |
| 地址: | 100089 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 知覺(jué) 音頻 編碼 信號(hào) 處理 方法 及其 柔性 濾波器 | ||
技術(shù)領(lǐng)域:
本發(fā)明涉及信號(hào)處理中數(shù)據(jù)壓縮及信號(hào)處理用濾波器,更詳細(xì)地說(shuō),它用于音頻信號(hào)的解相關(guān),從而提供一個(gè)消解冗余度的方法和裝置,除此之外,基于心理聲學(xué)模型,本發(fā)明還可用于分離具有不同重要性的信號(hào)分量。
背景技術(shù):
通常,知覺(jué)音頻編碼器的第一步操作是把輸入音頻信號(hào)從時(shí)間域映射到頻率域,其基本的思路為:把信號(hào)過(guò)濾成各頻率帶上的成分;一旦輸入信號(hào)在頻域上得以表達(dá),心理聲學(xué)模型就可以用來(lái)去除枝節(jié)信息;進(jìn)一步,把各頻帶上的成份分組。最后,通過(guò)合理地分配比特?cái)?shù)以表達(dá)各組頻率參數(shù)。由于音頻信號(hào)展現(xiàn)出強(qiáng)烈的準(zhǔn)周期性,這一過(guò)程可大大降低數(shù)據(jù)量、提升編碼效率。
最近的幾年里,一系列可用于信號(hào)成份分離和冗余度提取的時(shí)一頻域映射算法被開(kāi)發(fā)出來(lái)。這些性能各異的方法包括:
(1)Discrete?Fourier?transform(DFT),
(2)??iscrete?cosine?transform(DCT),
(3)??uadrature?mirror?filters(QMF),
(4)??Pseudo?QMF(PQMF),
(5)??Modified?DCT(MDCT),
(6)??Wavelet
上述各種變換具有不同的優(yōu)缺點(diǎn),不同的系統(tǒng)均是根據(jù)需要選用適當(dāng)?shù)淖儞Q作為其濾波器組的基本構(gòu)成。
MPEG-1,2?Layers?I和II采用了PQMF作為濾波器組。該濾波器組的優(yōu)點(diǎn)為:結(jié)構(gòu)相對(duì)簡(jiǎn)單、時(shí)間分辨率很好。其缺點(diǎn)為:鄰近子帶之間存在明顯的頻率重疊;單一頻率信號(hào)的變化可影響與其相鄰的二個(gè)子帶。2000Hz以下的頻帶寬度遠(yuǎn)大于心理聲學(xué)帶寬值,從而無(wú)法實(shí)現(xiàn)比特?cái)?shù)的最優(yōu)分配。實(shí)時(shí)運(yùn)算量偏大。
MPEG-1,2?Layer?III采用了PQMF和MDCT的級(jí)聯(lián)作為其濾波器組。雖然MDCT的引入可提升頻率分辨率從而改進(jìn)編碼效率,PQMF在鄰近子帶之間的頻率重疊仍然會(huì)導(dǎo)致信號(hào)的混迭,頻域量化噪聲在時(shí)間域上的擴(kuò)散比較嚴(yán)重。
MPEG-2,4?AAC采用了MDCT作為濾波器組(穩(wěn)態(tài)信號(hào):1024-點(diǎn)MDCT,暫態(tài)信號(hào):128-點(diǎn)MDCT),該濾波器組使用了二種重疊窗形狀:SINE和KBD。其優(yōu)點(diǎn)為:頻率分辨率很好;其缺點(diǎn)為:時(shí)間分辨率偏低。
MPEG-4?Twin?VQ的濾波器組與MPEG-2,4?AAC相似,除此之外,它采用了線(xiàn)性濾波器以白化頻譜系數(shù)并在量化級(jí)之前執(zhí)行歸一化操作。
AC-3的濾波器組對(duì)穩(wěn)態(tài)信號(hào)使用256-點(diǎn)MDCT,對(duì)暫態(tài)信號(hào)使用128-點(diǎn)MDCT,其塊長(zhǎng)選擇機(jī)制比較簡(jiǎn)單,選擇效果為次最優(yōu)。
ATRAC的濾波器組由前回波增益控制、PQF和MDCT級(jí)聯(lián)而成。它還采用了窗轉(zhuǎn)換機(jī)制以根據(jù)輸入信號(hào)的特性調(diào)整時(shí)頻分辨率。
DTS的濾波器組由512-tap?32子帶PQMF構(gòu)成。為了進(jìn)一步提取冗余度,一個(gè)線(xiàn)性濾波器可被級(jí)聯(lián)在PQMF之后。
上述所有的系統(tǒng)只采用一種變換配置去壓縮表達(dá)一個(gè)輸入信號(hào)幀。當(dāng)一個(gè)信號(hào)幀包含不同暫態(tài)特性的成份時(shí),單一的變換配置不足以滿(mǎn)足不同信號(hào)子幀對(duì)優(yōu)化壓縮的基本需求。
發(fā)明內(nèi)容:
為了提高音頻編碼的品質(zhì),必需消除信號(hào)中的不必要信息以及聽(tīng)眾覺(jué)察不到的成份。濾波器組的使用提供了一種去除冗余信息和枝節(jié)數(shù)據(jù)的最佳途徑。根據(jù)其功能,本發(fā)明目的包括:
(1)優(yōu)化分離具有不同知覺(jué)特性的信號(hào)成分。
(2)最小化前回波噪聲和由邊界之不連續(xù)性所導(dǎo)致的聽(tīng)覺(jué)塊毛刺。
(3)在保持音頻信號(hào)品質(zhì)的前提下,最小化數(shù)據(jù)量。
(4)實(shí)現(xiàn)精密抽樣(critically?sampled)和完全重構(gòu)或準(zhǔn)完全重構(gòu)(perfectreconstruction,or?nearly?perfect?reconstruction.)
(5)最小化時(shí)間延遲和運(yùn)算量。
為了實(shí)現(xiàn)上述目標(biāo),一些參數(shù)和機(jī)制必須被合理地制定。這些參數(shù)和機(jī)制包括:
(a)重疊窗的形狀極其優(yōu)選機(jī)制
(b)重疊窗的長(zhǎng)度極其優(yōu)選機(jī)制
在實(shí)際運(yùn)作中,單一的濾波器組不能夠滿(mǎn)足或基本滿(mǎn)足所有的信號(hào)成份對(duì)上述目標(biāo)的要求。本發(fā)明通過(guò)柔性組合多種濾波器及參數(shù)以?xún)?yōu)化表達(dá)一個(gè)輸入信號(hào)幀所包含的各種成份。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京阜國(guó)數(shù)字技術(shù)有限公司,未經(jīng)北京阜國(guó)數(shù)字技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/01134558.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種手機(jī)及應(yīng)用
- 下一篇:預(yù)涂飾裝飾紙箔制造方法
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 體征碼及其編碼方法
- 編碼裝置和編碼方法以及解碼裝置和解碼方法
- 聲音信號(hào)編碼方法、聲音信號(hào)解碼方法、編碼裝置、解碼裝置、聲音信號(hào)處理系統(tǒng)、聲音信號(hào)編碼程序以及聲音信號(hào)解碼程序
- 用于下一代視頻的編碼/未編碼的數(shù)據(jù)的內(nèi)容自適應(yīng)熵編碼
- 編碼光符號(hào)編碼
- 一種可變幀率的編碼方法及裝置
- 一種物聯(lián)網(wǎng)編碼方法及系統(tǒng)
- 點(diǎn)陣編碼及解碼方法
- 一種視頻編碼方法、裝置和存儲(chǔ)介質(zhì)
- 視頻編碼方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





