[發(fā)明專利]用于寬帶語音解碼中基音增強(qiáng)后處理的方法及裝置無效
| 申請?zhí)枺?/td> | 201210436092.9 | 申請日: | 2012-11-05 |
| 公開(公告)號: | CN102930872A | 公開(公告)日: | 2013-02-13 |
| 發(fā)明(設(shè)計)人: | 張勇;閆建新 | 申請(專利權(quán))人: | 深圳廣晟信源技術(shù)有限公司 |
| 主分類號: | G10L19/09 | 分類號: | G10L19/09;G10L19/12;G10L19/26 |
| 代理公司: | 深圳市順天達(dá)專利商標(biāo)代理有限公司 44217 | 代理人: | 李琴 |
| 地址: | 518057 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 寬帶 語音 解碼 基音 增強(qiáng) 處理 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音編解碼技術(shù),更具體地說,涉及一種用于寬帶語音解碼中基音增強(qiáng)后處理的方法及裝置。
背景技術(shù)
語音編/解碼器廣泛地應(yīng)用于數(shù)字通信系統(tǒng),有效的發(fā)送/存儲語音信號。在數(shù)字系統(tǒng)中,輸入的模擬語音信號經(jīng)過采樣轉(zhuǎn)化到數(shù)字域,在數(shù)字域中,對連續(xù)的語音采樣做進(jìn)一步處理。即語音編碼器的輸入為語音采樣,輸出則為壓縮的比特流。壓縮的比特流通過信道傳入解碼端,語音解碼器接收該比特流,并產(chǎn)生重構(gòu)的語音信號。
在CELP(Code?Excited?Linear?Prediction,碼激勵線性預(yù)測)編碼中,數(shù)字語音信號以幀為單位進(jìn)行編碼傳輸。對于每幀數(shù)字語音信號,編碼器從中抽取多個編碼參數(shù),并將這些編碼參數(shù)發(fā)送/存儲。而CELP解碼器則是處理所接收的編碼參數(shù)重構(gòu)合成語音信號的指定幀。在CELP編解碼模式下,信道中傳輸?shù)木幋a參數(shù)有:
LSF(Linear?Spectrum?Frequencies,線譜頻率)或ISF(Immitance?Spectrum?Frequencies,導(dǎo)譜頻率);
基音參數(shù),包括基音延遲和基音增益;
革新激勵參數(shù),包括固定碼本索引和增益;
LSF或ISF系數(shù)按幀為單位進(jìn)行編碼傳輸,基音參數(shù)和革新激勵參數(shù)一般按子幀為單位進(jìn)行編碼傳輸。其中,基音參數(shù)和革新激勵參數(shù)描述了激勵信號。LSF/ISF是LP(Linear?Prediction,線性預(yù)測)濾波器的系數(shù)的頻域表現(xiàn)形式。激勵信號可以看作聲門的輸出,LP濾波器可以看作聲道模型。所以當(dāng)激勵信號通過LP濾波器后,就得到輸出的合成語音信號。
當(dāng)前的各種語音編解碼器,解碼得到的重建語音信號不會和原始語音信號相同。壓縮比越高,編碼失真就越大。為了提升解碼重建信號的質(zhì)量,在解碼端可以進(jìn)行各種增強(qiáng)后處理。
在CELP編碼模式中,其激勵產(chǎn)生的二元模型中包括了模擬濁音特性的自適應(yīng)碼本激勵和模擬清音特性的固定碼本激勵,其總的激勵為自適應(yīng)碼本激勵和固定碼本激勵的和,最后總的激勵通過一個合成濾波器得到合成語音。由于人耳對低頻信號比較敏感,在寬帶語音編碼中,可以通過增強(qiáng)激勵碼矢的低頻部分的分量,即增強(qiáng)了激勵信號中低頻部分的貢獻(xiàn),從而增強(qiáng)了低頻部分的周期性,最終提高合成語音信號的質(zhì)量。
AMR-WB+是3GPP(The?3rd?Generation?Partnership?Project,第三代合作伙伴計劃)主持制定的一個寬帶音頻編解碼標(biāo)準(zhǔn),主要應(yīng)用于移動多媒體壓縮。AMR-WB+編解碼標(biāo)準(zhǔn)中,便使用了基音增強(qiáng)后處理,具體實現(xiàn)方法如下:
將激勵碼矢通過一個濾波器,降低激勵碼矢中固定碼矢的低頻分量,即提升自適應(yīng)碼矢激勵低頻部分的貢獻(xiàn),從而增強(qiáng)了激勵信號中低頻部分的周期性,其中使用的濾波器的轉(zhuǎn)移函數(shù)為:
F(z)=-αz+1-αz-1,
其中α是周期因子,計算如下:
α=0.125(1+rv),
其中,rv=(Ev-Ec)/(Ev+Ec),
其中,Ev為被縮放的自適應(yīng)碼矢的能量,
Ec為被縮放的固定碼矢的能量,
b為自適應(yīng)碼本增益,v為自適應(yīng)碼本激勵,g為固定碼本增益,c為固定碼本激勵。
其中,-1≤rv≤1。當(dāng)rv=-1時為純清音;當(dāng)rv=1時為純濁音。相應(yīng)的,對于純清音,α=0;對于純濁音,α=0.25。α=0.25時濾波器F(z)=-αz+1-αz-1的頻譜圖如圖1所示。α=0..1時濾波器F(z)=-αz+1-αz-1的頻譜圖如圖2所示。
AMR-WB+編解碼標(biāo)準(zhǔn)中采用的基音增強(qiáng)后處理方法在對革新碼矢濾波后,改變了革新碼矢的能量,但在最后沒有做能量平滑,使得基音增強(qiáng)后的激勵信號的能量普遍偏小。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述缺陷,提供一種用于寬帶語音解碼中基音增強(qiáng)后處理的方法和裝置,能夠在不增加額外傳輸比特率的條件下以較低的運(yùn)算復(fù)雜度實現(xiàn)基音增強(qiáng)處理和能量平滑,以達(dá)到寬帶解碼語音信號主觀音質(zhì)的提高。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:提出一種用于寬帶語音解碼中基音增強(qiáng)后處理的方法,包括如下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳廣晟信源技術(shù)有限公司,未經(jīng)深圳廣晟信源技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210436092.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





