[發(fā)明專利]用于音頻編解碼中的響度和銳度補(bǔ)償?shù)姆椒ê驮O(shè)備有效
| 申請?zhí)枺?/td> | 201080052229.X | 申請日: | 2010-06-29 |
| 公開(公告)號: | CN102725791A | 公開(公告)日: | 2012-10-10 |
| 發(fā)明(設(shè)計(jì))人: | 沃洛佳·格蘭恰諾夫;西德格爾·思維里森 | 申請(專利權(quán))人: | 瑞典愛立信有限公司 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L19/14 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 王瑋 |
| 地址: | 瑞典斯*** | 國省代碼: | 瑞典;SE |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 音頻 解碼 中的 響度 補(bǔ)償 方法 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明總體上涉及音頻編解碼,更具體地,涉及執(zhí)行或支持對音頻編碼中的響度和銳度限制的補(bǔ)償?shù)膸挃U(kuò)展方案。
背景技術(shù)
心理聲學(xué)領(lǐng)域指的是對聲音的感知的研究。這包括:人類如何聽、他們的心理響應(yīng)、以及音樂和聲音對人類神經(jīng)系統(tǒng)的心理影響。具體地,對于現(xiàn)代通信系統(tǒng)的開發(fā),在新的數(shù)字音頻技術(shù)的開發(fā)和現(xiàn)有技術(shù)的改進(jìn)中,聽覺系統(tǒng)如何處理音頻激勵的知識很重要。作為多媒體和廣播服務(wù)中的基本組件的音頻編解碼器基于關(guān)于人類聽覺系統(tǒng)的特性的知識來以低的比特率壓縮音頻信息,進(jìn)行有效的傳輸和存儲。另外,已經(jīng)開發(fā)了用以模擬對音頻質(zhì)量的主觀評估的客觀的質(zhì)量測量方案,其也很大程度上基于心理聲學(xué)知識。
幾乎所有現(xiàn)代音頻編解碼[1-5]都利用下述概念:僅編碼和傳送音頻信號的部分信號頻率分量,以及在解碼器中重構(gòu)音頻信號的剩余頻率。通常,僅傳送信號的低頻帶(LB),隨后借助所稱的帶寬擴(kuò)展(BWE)來重構(gòu)信號的高頻帶(HB)。在典型的BWE方案中,通過平移或翻轉(zhuǎn)來自相鄰頻帶的可用頻率分量(通常是可用的LB)來擴(kuò)展信號的頻率內(nèi)容。然而,由于重構(gòu)信號中可以感知的某些偽音,以這種方式重構(gòu)的信號不具有與原始音頻信號的HB精確匹配的HB。為了最小化這些偽音的影響,在BWE方案中,通常將重構(gòu)HB的增益保持為低于原始HB的增益,其導(dǎo)致重構(gòu)信號具有修改的心理聲學(xué)特性。其中最受影響的特性是對響度的感知和對銳度的感知。響度與信號強(qiáng)度或語音信號的聲壓有關(guān)。銳度與語音信號的頻率上的能量分布有關(guān),并且隨著高頻分量的相對增加而增大。當(dāng)信號是帶寬受限信號或應(yīng)用了傳統(tǒng)BWE方案時(shí),感知的重構(gòu)信號的響度和銳度與原始信號相比有所降低,這導(dǎo)致主觀質(zhì)量下降。
因此,需要能夠提高感知的接收/解碼信號的響度和銳度的方法和設(shè)備。
發(fā)明內(nèi)容
本發(fā)明涉及改進(jìn)的帶寬擴(kuò)展方案。
本發(fā)明的一個(gè)目的是提供用于改善感知的語音信號質(zhì)量的方法和系統(tǒng)。
另一目的是能夠改善感知的重構(gòu)語音信號的響度和銳度。
一個(gè)特定目的是提供用于處理語音信號的編碼器和解碼器設(shè)備。
另一特定目的是提供用于處理語音信號的方法。
又一個(gè)特定目的是提供濾波器設(shè)備。
在改善限定在預(yù)定帶寬內(nèi)的重構(gòu)語音信號的感知響度和銳度的第一方面,提供(S10)語音信號。隨后,將語音信號至少劃分成第一信號部分和第二信號部分,所述第一信號部分基于所述預(yù)定帶寬的第一帶寬部分,所述第二信號部分基于所述預(yù)定帶寬的第二帶寬部分。隨后,調(diào)整第一信號部分,以至少加強(qiáng)第一帶寬部分內(nèi)的預(yù)定頻率或頻率間隔。最后,至少基于第一信號部分來重構(gòu)第二信號部分,以及將調(diào)整后的第一信號部分與重構(gòu)的第二信號部分進(jìn)行組合以提供具有整體提高的感知響度和銳度的重構(gòu)語音信號。
在本公開的第二方面,一種用于改善限定在預(yù)定帶寬內(nèi)的重構(gòu)語音信號的感知響度和銳度的系統(tǒng)包括:配置為提供語音信號的裝置。另外,在系統(tǒng)中提供了配置為將語音信號至少劃分成第一信號部分和第二信號部分的裝置,所述第一信號部分基于所述預(yù)定帶寬的第一帶寬部分,所述第二信號部分基于所述預(yù)定帶寬的第二帶寬部分。另外,在系統(tǒng)中提供了配置為調(diào)整第一信號部分以至少加強(qiáng)第一帶寬部分內(nèi)的預(yù)定頻率或頻率間隔的裝置。最后,該系統(tǒng)包括配置為至少基于第一信號部分來重構(gòu)第二信號部分的裝置,以及配置為將調(diào)整后的第一信號部分與重構(gòu)的第二信號部分進(jìn)行組合以提供具有整體提高的感知響度和銳度的重構(gòu)語音信號的裝置。
在本公開的第三發(fā)明,一種在通信系統(tǒng)中用于處理限定在預(yù)定帶寬內(nèi)的語音信號的編碼器設(shè)備包括配置為提供語音信號的裝置。另外,該編碼器設(shè)備包括配置為將語音信號至少劃分成第一信號部分和第二信號部分的裝置,所述第一信號部分基于所述預(yù)定帶寬的第一帶寬部分,所述第二信號部分基于所述預(yù)定帶寬的第二帶寬部分。另外,該編碼器設(shè)備包括配置為調(diào)整第一信號部分以至少加強(qiáng)第一帶寬部分內(nèi)的預(yù)定頻率或頻率間隔的裝置,以及配置為用于向另一節(jié)點(diǎn)至少傳送調(diào)整后的第一信號部分的裝置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于瑞典愛立信有限公司,未經(jīng)瑞典愛立信有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201080052229.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





