[發(fā)明專利]編碼裝置和編碼方法有效
| 申請?zhí)枺?/td> | 201611125260.7 | 申請日: | 2012-08-24 |
| 公開(公告)號: | CN106847295B | 公開(公告)日: | 2021-03-23 |
| 發(fā)明(設(shè)計)人: | 河島拓也;大毛勝統(tǒng);押切正浩 | 申請(專利權(quán))人: | 松下電器(美國)知識產(chǎn)權(quán)公司 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L21/0388 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 邸萬奎 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 編碼 裝置 方法 | ||
本發(fā)明的編碼裝置包括:第一編碼單元,對作為語音信號和/或音樂信號的輸入信號中,作為低頻帶的低頻部分進行編碼,生成第一編碼數(shù)據(jù);振幅歸一化單元,將解碼第一編碼數(shù)據(jù)所得到的第一頻譜劃分為多個子帶,并在多個子帶中以各子帶內(nèi)的振幅的最大值分別進行歸一化,從而生成低頻部分的歸一化頻譜;頻帶搜索單元,搜索在輸入信號的高于低頻的高頻帶的擴展頻帶的頻譜即第二頻譜與低頻部分的歸一化頻譜之間相關(guān)值最大的特定的頻帶,頻帶搜索單元將以低頻部分的歸一化頻譜的振幅值為非零的位置為起點的頻帶作為多個候選,從多個候選中搜索相關(guān)值最大的特定的頻帶。
本申請是國際申請日為2012年8月24日、申請?zhí)枮?01280036790.8、發(fā)明名稱為“編碼裝置、解碼裝置、編碼方法和解碼方法”的發(fā)明專利申請的分案申請。
技術(shù)領(lǐng)域
本發(fā)明涉及編碼裝置、解碼裝置、編碼方法和解碼方法。
背景技術(shù)
專利文獻1中,公開了能夠?qū)Τ瑢拵?Super-Wide-band:SWB。一般為0.05~14kHz頻帶)的語音信號或音樂信號高效率地進行編碼的技術(shù),該技術(shù)在ITU-T中已標準化(例如,非專利文獻1和2)。該技術(shù)中,語音信號或音樂信號等輸入信號的低頻部分(例如,7kHz以下的頻帶)由核心編碼單元進行編碼,高頻部分(例如,高于7kHz的頻帶)由擴展頻帶編碼單元進行編碼。
另外,一般而言,核心編碼單元使用CELP(Code Excited Linear Prediction:碼激勵線性預(yù)測)編碼。另一方面,擴展頻帶編碼單元使用由核心編碼單元進行了編碼的信息在頻域中進行編碼。具體而言,擴展頻帶編碼單元對由核心編碼單元進行了編碼的低頻部分(7kHz以下)的窄頻帶信號進行解碼,將變換為MDCT(Modified Discrete CosineTransform:改進的離散余弦變換)系數(shù)(頻譜)得到的頻譜(低頻解碼頻譜)用于高頻部分(頻率高于7kHz的頻帶。以下稱為“擴展頻帶”)的編碼。
在擴展頻帶中進行編碼時,首先,對于由核心編碼單元生成的低頻解碼頻譜,用頻譜功率的包絡(luò)(或包絡(luò)線(envelope)。以下稱為包絡(luò)線)進行歸一化。具體而言,將包含低頻解碼譜的低頻部分劃分為多個子帶,對每個子帶計算能量(子帶能量)。接著,進行子帶能量的平滑化,以使頻域中的能量變動平滑。接著,使用平滑化后的子帶能量,進行各子帶中包含的頻譜的歸一化。擴展頻帶編碼單元在如上得到的頻譜(歸一化頻譜)與輸入信號的擴展頻帶頻譜之間搜索相關(guān)性高的頻帶,將表示相關(guān)性高的頻帶的信息作為滯后(lag)進行編碼。另外,擴展頻帶編碼單元將相關(guān)性高的低頻頻帶復(fù)制(copy)到擴展頻帶,以將相關(guān)性高的低頻頻帶用作擴展頻帶的頻譜精細結(jié)構(gòu)(頻率精細結(jié)構(gòu))。然后,擴展頻帶編碼單元在頻譜精細結(jié)構(gòu)與擴展頻帶頻譜之間計算增益,并對增益進行編碼。
通過進行以上處理,從低頻的頻譜生成擴展頻帶的頻譜。
此外,在輸入信號中從低頻頻譜生成擴展頻帶頻譜時對低頻頻譜進行歸一化的理由如下。一般而言,在低頻頻譜中能量的偏頗非常大,在高頻的擴展頻帶頻譜中能量的偏頗小。即,高頻部分中,與低頻部分相比,局部性地出現(xiàn)大峰值的情況較少,因而若將高峰性高的信號復(fù)制到高頻部分(擴展頻帶),則有可能導(dǎo)致音質(zhì)劣化。因此,在編碼裝置中對低頻頻譜進行歸一化是因為,在消除低頻頻譜的能量偏頗來進行平坦化(歸一化)之后計算與擴展頻帶頻譜之間的相關(guān)性,則能夠更高效率地進行編碼。
另一方面,非專利文獻3中公開了在核心編碼單元中使用變換編碼的現(xiàn)有技術(shù)。在該現(xiàn)有技術(shù)中,將MPEG(Moving Picture Experts Group,動態(tài)圖像專家組)AAC(高級音頻編碼)方式用于核心編碼單元。另外,使用與上述說明的擴展頻帶的編碼方式不同的SBR(Spectral Band Replication,頻帶復(fù)制)方式進行擴展頻帶的編碼。
現(xiàn)有技術(shù)文獻
專利文獻
[專利文獻1]日本特表2009-515212號公報
非專利文獻
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于松下電器(美國)知識產(chǎn)權(quán)公司,未經(jīng)松下電器(美國)知識產(chǎn)權(quán)公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611125260.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種通信設(shè)備及增益控制方法
- 下一篇:用于蜂窩通信的定時提前增強





