[發(fā)明專利]解碼器系統(tǒng)和解碼方法有效
| 申請(qǐng)?zhí)枺?/td> | 201510437095.8 | 申請(qǐng)日: | 2011-04-06 |
| 公開(公告)號(hào): | CN105023578B | 公開(公告)日: | 2018-10-19 |
| 發(fā)明(設(shè)計(jì))人: | 海科·普爾哈根;蓬圖斯·卡爾森;拉爾斯·維爾默斯 | 申請(qǐng)(專利權(quán))人: | 杜比國(guó)際公司 |
| 主分類號(hào): | G10L19/008 | 分類號(hào): | G10L19/008 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 陳煒;李德山 |
| 地址: | 荷蘭阿*** | 國(guó)省代碼: | 荷蘭;NL |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 解碼器 系統(tǒng) 解碼 方法 | ||
本發(fā)明提供一種解碼器系統(tǒng)及解碼方法。該解碼器系統(tǒng)通過復(fù)數(shù)預(yù)測(cè)立體聲編碼提供立體聲信號(hào),包括:上混級(jí),基于下混信號(hào)和殘留信號(hào)的第一頻域表示產(chǎn)生立體聲信號(hào),每個(gè)第一頻域表示包括第一頻譜分量,上混級(jí)包括:基于下混信號(hào)的第一頻域表示計(jì)算下混信號(hào)的第二頻域表示的模塊,第二頻域表示包括第二頻譜分量,該模塊通過對(duì)下混信號(hào)的第一頻譜分量應(yīng)用有限脈沖響應(yīng)濾波確定下混信號(hào)的第二頻譜分量;加權(quán)求和器,基于下混信號(hào)的第一和第二頻域表示、殘留信號(hào)的第一頻域表示和編碼在比特流信號(hào)中的復(fù)數(shù)預(yù)測(cè)系數(shù)計(jì)算側(cè)邊信號(hào);求和與求差級(jí),基于下混信號(hào)的第一頻域表示和側(cè)邊信號(hào)計(jì)算立體聲信號(hào),上混級(jí)對(duì)下混信號(hào)和殘留信號(hào)施加獨(dú)立的帶寬限制。
本申請(qǐng)為2011年4月6日遞交的國(guó)際申請(qǐng)?zhí)枮镻CT/EP2011/055374 (國(guó)家申請(qǐng)?zhí)枮?01180025305.2)、發(fā)明名稱為“基于改進(jìn)型離散余弦變換的復(fù)數(shù)預(yù)測(cè)立體聲編碼”的專利申請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
這里公開的本發(fā)明總的來說涉及立體聲音頻編碼,更確切地,涉及在頻域中使用復(fù)數(shù)預(yù)測(cè)進(jìn)行立體聲編碼的技術(shù)。
背景技術(shù)
立體聲信號(hào)左(L)和右(R)聲道的聯(lián)合編碼與L和R的獨(dú)立編碼相比能夠更有效地編碼。用于聯(lián)合立體聲編碼的普通方法是中/側(cè)(mid /side,M/S)編碼。這里,中間(M)信號(hào)通過將L和R信號(hào)相加而形成,例如,該M信號(hào)可具有如下形式:
M=(L+R)/2
此外,側(cè)邊(side,S)信號(hào)通過將兩聲道L和R信號(hào)相減而形成,例如,該S信號(hào)可具有如下形式:
S=(L-R)/2
在M/S編碼情況下,M和S信號(hào)而不是L和R信號(hào)被編碼。
在運(yùn)動(dòng)圖像專家組(Moving Picture Experts Group,MPEG)高級(jí)音頻編碼(Advanced Audio Coding,AAC)標(biāo)準(zhǔn)中(見標(biāo)準(zhǔn)文件ISO/IEC 13818-7),能夠以時(shí)變和頻變方式選擇L/R立體聲編碼和M/S立體聲編碼。因此,立體聲編碼器能夠?qū)αⅢw聲信號(hào)的某些頻帶應(yīng)用L/R編碼,而M/S 編碼用于編碼該立體聲信號(hào)的其他頻帶(頻變)。此外,該編碼器能夠隨時(shí)間在L/R和M/S編碼之間切換(時(shí)變)。在MPEG AAC中,立體聲編碼在頻域中進(jìn)行,更具體而言,在改進(jìn)型離散余弦變換(modified discrete cosine transform,MDCT)域中進(jìn)行。這允許以頻率和時(shí)間可變的方式自適應(yīng)地選擇L/R或M/S編碼。
參數(shù)立體聲編碼是用于有效地將立體聲音頻信號(hào)編碼為單耳聽覺信號(hào)加少量用于立體聲參數(shù)的邊信息的技術(shù)。其是MPEG-4音頻標(biāo)準(zhǔn)(見標(biāo)準(zhǔn)文件ISO/IEC 14496-3)的一部分。能夠使用任何音頻編碼器對(duì)單耳聽覺信號(hào)編碼。立體聲參數(shù)可被嵌入單聲道比特流的輔助部分,從而實(shí)現(xiàn)完全的向前和向后兼容。在解碼器中,首先解碼的是單耳聽覺信號(hào),在這之后,借助于立體聲參數(shù)重建立體聲信號(hào)。通過去相關(guān)器(例如,可包括一條或更多條延遲線的適當(dāng)?shù)娜V波器)來產(chǎn)生已解碼單聲道信號(hào)的去相關(guān)版本,其與單聲道信號(hào)零互相關(guān)。本質(zhì)上,已去相關(guān)信號(hào)具有與單聲道信號(hào)相同的頻譜和時(shí)間能量分布。單耳聽覺信號(hào)連同已去相關(guān)信號(hào)被輸入到通過立體聲參數(shù)來控制并重建立體聲信號(hào)的上混(up-mix)處理。更多信息參見H.Purnhagen所著的論文:“Low complexity Parametric StereoCoding in MPEG-4(MPEG-4中的低復(fù)雜度參數(shù)立體聲編碼)”(第七屆數(shù)字音頻影響國(guó)際會(huì)議(DAFx’04)會(huì)刊,意大利那不勒斯,2004年10月 5-8日,第163至168頁)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杜比國(guó)際公司,未經(jīng)杜比國(guó)際公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510437095.8/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語音分析或合成;語音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





