[發(fā)明專利]編碼裝置、解碼裝置及其方法有效
| 申請(qǐng)?zhí)枺?/td> | 201080048615.1 | 申請(qǐng)日: | 2010-10-29 |
| 公開(公告)號(hào): | CN102598124A | 公開(公告)日: | 2012-07-18 |
| 發(fā)明(設(shè)計(jì))人: | 劉宗憲;張國(guó)成 | 申請(qǐng)(專利權(quán))人: | 松下電器產(chǎn)業(yè)株式會(huì)社 |
| 主分類號(hào): | G10L19/02 | 分類號(hào): | G10L19/02;G10L19/10 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 邸萬奎 |
| 地址: | 日本*** | 國(guó)省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 編碼 裝置 解碼 及其 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及編碼裝置、解碼裝置及其方法。
背景技術(shù)
在語音編碼中,主要存在兩個(gè)類型的編碼技術(shù),即變換編碼和TCX(Transform?Coded?excitation,變換碼激勵(lì))編碼(例如,參照非專利文獻(xiàn)1)。
變換編碼例如包括如下步驟:使用離散傅立葉變換(DFT)或改進(jìn)離散余弦變換(MDCT),將信號(hào)從時(shí)域變換為頻域。另外,變換編碼中,將頻譜系數(shù)量化而進(jìn)行編碼。幾種一般的變換編碼有MPEG?MP3、MPEGACC(例如參照非專利文獻(xiàn)2)、以及Dolby?AC3。變換編碼在音樂信號(hào)和一般的語音信號(hào)中很有效率。圖1表示變換編碼系統(tǒng)10的簡(jiǎn)化結(jié)構(gòu)。
圖1所示的變換編碼系統(tǒng)10的編碼裝置中,時(shí)間-頻率變換單元11使用離散傅立葉變換(DFT)或改進(jìn)離散余弦變換(MDCT)等,將時(shí)域的信號(hào)S(n)變換為頻域的信號(hào)S(f)。頻譜系數(shù)量化單元12對(duì)頻域的信號(hào)S(f)進(jìn)行量化,從而獲得量化參數(shù)。復(fù)用單元13將量化參數(shù)進(jìn)行復(fù)用并傳輸?shù)浇獯a裝置側(cè)。
在圖1所示的變換編碼系統(tǒng)10的解碼裝置中,首先,分離單元14分離所有的比特流信息而生成量化參數(shù)。頻譜系數(shù)解碼單元15對(duì)量化參數(shù)進(jìn)行解碼,生成被解碼的頻域信號(hào)S~(f)。頻率-時(shí)間變換單元16使用離散傅立葉逆變換(IDFT)或改進(jìn)離散余弦逆變換(IMDCT)等,將被解碼的頻域的信號(hào)S~(f)變換為時(shí)域,從而生成被解碼的時(shí)域的信號(hào)S~(n)。
相對(duì)于此,在TCX編碼中,使用時(shí)域(線性預(yù)測(cè))技術(shù)和頻域(變換編碼)技術(shù)的組合。TCX編碼中,利用時(shí)域中的語音信號(hào)的冗余性,對(duì)輸入語音信號(hào)應(yīng)用線性預(yù)測(cè),由此獲得殘差(激勵(lì))信號(hào)。在為語音信號(hào)的情況下,特別在為有聲區(qū)間(諧振效應(yīng)和較高的基音周期分量)的情況下,通過該模式,可極為高效地生成音頻再現(xiàn)信號(hào)。在線性預(yù)測(cè)之后,將殘差(激勵(lì))信號(hào)變換為頻域,并高效率地進(jìn)行編碼。一般的幾種TCX編碼有AMR-WB+、ITU.T?G.729.1和ITU.T?G.718(例如,參照非專利文獻(xiàn)4)。圖2表示TCX編碼系統(tǒng)20的簡(jiǎn)化結(jié)構(gòu)。
在圖2所示的TCX編碼系統(tǒng)20的編碼裝置中,LPC分析單元21為了利用時(shí)域中的信號(hào)的冗余性,對(duì)于輸入信號(hào)進(jìn)行LPC分析。LPC反濾波器單元22使用來自LPC分析的LPC系數(shù),對(duì)輸入信號(hào)S(n)適用LPC反濾波器,從而獲得殘差(激勵(lì))信號(hào)Sr(n)。時(shí)間-頻率變換單元23使用例如離散傅立葉變換(DFT)或改進(jìn)離散余弦變換(MDCT)等,將殘差信號(hào)Sr(n)變換為頻域的信號(hào)Sr(f)。頻譜系數(shù)量化單元24對(duì)頻域的信號(hào)Sr(f)進(jìn)行量化,復(fù)用單元25將量化參數(shù)進(jìn)行復(fù)用并傳輸?shù)浇獯a裝置側(cè)。
在圖2所示的TCX編碼系統(tǒng)20的解碼裝置中,首先,分離單元26分離所有的比特流信息而生成量化參數(shù)。頻譜系數(shù)解碼單元27對(duì)量化參數(shù)進(jìn)行解碼,生成被解碼的頻域的殘差信號(hào)S~r(f)。頻率-時(shí)間變換單元28使用離散傅立葉逆變換(IDFT)或改進(jìn)離散余弦逆變換(IMDCT)等,將被解碼的頻域的殘差信號(hào)S~r(f)變換為時(shí)域,從而生成被解碼的時(shí)域的殘差信號(hào)S~r(n)。LPC合成濾波器單元29使用被解碼的LPC參數(shù),對(duì)被解碼的時(shí)域的殘差信號(hào)S~r(n)進(jìn)行處理,獲得被解碼的時(shí)域的信號(hào)S~(n)。
變換編碼和TCX編碼中的變換編碼部分一般都利用某種量化方法來進(jìn)行。矢量量化中的一種方法稱為脈沖矢量編碼(pulse?vector?coding)。例如,在非專利文獻(xiàn)3中,提出了在MDCT區(qū)域中對(duì)LPC殘差進(jìn)行量化的階乘脈沖編碼(Factorial?Pulse?Coding,是一種脈沖矢量編碼)(參照?qǐng)D4)。階乘脈沖編碼是一種脈沖矢量編碼,脈沖矢量編碼的編碼信息是單位振幅脈沖(unit?magnitude?pulse)。在新標(biāo)準(zhǔn)化的語音編碼ITU-T?G.718中,以在MDCT區(qū)域中對(duì)LPC殘差進(jìn)行量化為目的,在第五層使用階乘脈沖編碼(FPC)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于松下電器產(chǎn)業(yè)株式會(huì)社,未經(jīng)松下電器產(chǎn)業(yè)株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201080048615.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語音分析或合成;語音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 體征碼及其編碼方法
- 編碼裝置和編碼方法以及解碼裝置和解碼方法
- 聲音信號(hào)編碼方法、聲音信號(hào)解碼方法、編碼裝置、解碼裝置、聲音信號(hào)處理系統(tǒng)、聲音信號(hào)編碼程序以及聲音信號(hào)解碼程序
- 用于下一代視頻的編碼/未編碼的數(shù)據(jù)的內(nèi)容自適應(yīng)熵編碼
- 編碼光符號(hào)編碼
- 一種可變幀率的編碼方法及裝置
- 一種物聯(lián)網(wǎng)編碼方法及系統(tǒng)
- 點(diǎn)陣編碼及解碼方法
- 一種視頻編碼方法、裝置和存儲(chǔ)介質(zhì)
- 視頻編碼方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





