[發(fā)明專利]編碼裝置、解碼裝置及其方法有效

申請(qǐng)?zhí)枺?/td>	201080048615.1	申請(qǐng)日：	2010-10-29
公開（公告）號(hào)：	CN102598124A	公開（公告）日：	2012-07-18
發(fā)明（設(shè)計(jì)）人：	劉宗憲;張國(guó)成	申請(qǐng)（專利權(quán)）人：	松下電器產(chǎn)業(yè)株式會(huì)社
主分類號(hào)：	G10L19/02	分類號(hào)：	G10L19/02;G10L19/10
代理公司：	北京市柳沈律師事務(wù)所 11105	代理人：	邸萬奎
地址：	日本***	國(guó)省代碼：	日本;JP
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	編碼裝置解碼及其方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及編碼裝置、解碼裝置及其方法。

背景技術(shù)

在語音編碼中，主要存在兩個(gè)類型的編碼技術(shù)，即變換編碼和TCX(Transform?Coded?excitation，變換碼激勵(lì))編碼(例如，參照非專利文獻(xiàn)1)。

變換編碼例如包括如下步驟：使用離散傅立葉變換(DFT)或改進(jìn)離散余弦變換(MDCT)，將信號(hào)從時(shí)域變換為頻域。另外，變換編碼中，將頻譜系數(shù)量化而進(jìn)行編碼。幾種一般的變換編碼有MPEG?MP3、MPEGACC(例如參照非專利文獻(xiàn)2)、以及Dolby?AC3。變換編碼在音樂信號(hào)和一般的語音信號(hào)中很有效率。圖1表示變換編碼系統(tǒng)10的簡(jiǎn)化結(jié)構(gòu)。

圖1所示的變換編碼系統(tǒng)10的編碼裝置中，時(shí)間-頻率變換單元11使用離散傅立葉變換(DFT)或改進(jìn)離散余弦變換(MDCT)等，將時(shí)域的信號(hào)S(n)變換為頻域的信號(hào)S(f)。頻譜系數(shù)量化單元12對(duì)頻域的信號(hào)S(f)進(jìn)行量化，從而獲得量化參數(shù)。復(fù)用單元13將量化參數(shù)進(jìn)行復(fù)用并傳輸?shù)浇獯a裝置側(cè)。

在圖1所示的變換編碼系統(tǒng)10的解碼裝置中，首先，分離單元14分離所有的比特流信息而生成量化參數(shù)。頻譜系數(shù)解碼單元15對(duì)量化參數(shù)進(jìn)行解碼，生成被解碼的頻域信號(hào)S^～(f)。頻率-時(shí)間變換單元16使用離散傅立葉逆變換(IDFT)或改進(jìn)離散余弦逆變換(IMDCT)等，將被解碼的頻域的信號(hào)S^～(f)變換為時(shí)域，從而生成被解碼的時(shí)域的信號(hào)S^～(n)。

相對(duì)于此，在TCX編碼中，使用時(shí)域(線性預(yù)測(cè))技術(shù)和頻域(變換編碼)技術(shù)的組合。TCX編碼中，利用時(shí)域中的語音信號(hào)的冗余性，對(duì)輸入語音信號(hào)應(yīng)用線性預(yù)測(cè)，由此獲得殘差(激勵(lì))信號(hào)。在為語音信號(hào)的情況下，特別在為有聲區(qū)間(諧振效應(yīng)和較高的基音周期分量)的情況下，通過該模式，可極為高效地生成音頻再現(xiàn)信號(hào)。在線性預(yù)測(cè)之后，將殘差(激勵(lì))信號(hào)變換為頻域，并高效率地進(jìn)行編碼。一般的幾種TCX編碼有AMR-WB+、ITU.T?G.729.1和ITU.T?G.718(例如，參照非專利文獻(xiàn)4)。圖2表示TCX編碼系統(tǒng)20的簡(jiǎn)化結(jié)構(gòu)。

在圖2所示的TCX編碼系統(tǒng)20的編碼裝置中，LPC分析單元21為了利用時(shí)域中的信號(hào)的冗余性，對(duì)于輸入信號(hào)進(jìn)行LPC分析。LPC反濾波器單元22使用來自LPC分析的LPC系數(shù)，對(duì)輸入信號(hào)S(n)適用LPC反濾波器，從而獲得殘差(激勵(lì))信號(hào)S_r(n)。時(shí)間-頻率變換單元23使用例如離散傅立葉變換(DFT)或改進(jìn)離散余弦變換(MDCT)等，將殘差信號(hào)S_r(n)變換為頻域的信號(hào)S_r(f)。頻譜系數(shù)量化單元24對(duì)頻域的信號(hào)S_r(f)進(jìn)行量化，復(fù)用單元25將量化參數(shù)進(jìn)行復(fù)用并傳輸?shù)浇獯a裝置側(cè)。

在圖2所示的TCX編碼系統(tǒng)20的解碼裝置中，首先，分離單元26分離所有的比特流信息而生成量化參數(shù)。頻譜系數(shù)解碼單元27對(duì)量化參數(shù)進(jìn)行解碼，生成被解碼的頻域的殘差信號(hào)S^～_r(f)。頻率-時(shí)間變換單元28使用離散傅立葉逆變換(IDFT)或改進(jìn)離散余弦逆變換(IMDCT)等，將被解碼的頻域的殘差信號(hào)S^～_r(f)變換為時(shí)域，從而生成被解碼的時(shí)域的殘差信號(hào)S^～_r(n)。LPC合成濾波器單元29使用被解碼的LPC參數(shù)，對(duì)被解碼的時(shí)域的殘差信號(hào)S^～_r(n)進(jìn)行處理，獲得被解碼的時(shí)域的信號(hào)S^～(n)。

變換編碼和TCX編碼中的變換編碼部分一般都利用某種量化方法來進(jìn)行。矢量量化中的一種方法稱為脈沖矢量編碼(pulse?vector?coding)。例如，在非專利文獻(xiàn)3中，提出了在MDCT區(qū)域中對(duì)LPC殘差進(jìn)行量化的階乘脈沖編碼(Factorial?Pulse?Coding，是一種脈沖矢量編碼)(參照?qǐng)D4)。階乘脈沖編碼是一種脈沖矢量編碼，脈沖矢量編碼的編碼信息是單位振幅脈沖(unit?magnitude?pulse)。在新標(biāo)準(zhǔn)化的語音編碼ITU-T?G.718中，以在MDCT區(qū)域中對(duì)LPC殘差進(jìn)行量化為目的，在第五層使用階乘脈沖編碼(FPC)。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于松下電器產(chǎn)業(yè)株式會(huì)社，未經(jīng)松下電器產(chǎn)業(yè)株式會(huì)社許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201080048615.1/2.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。