[發(fā)明專利]音頻編解碼方法、裝置、介質(zhì)及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202010592469.4 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN112767954A | 公開(公告)日: | 2021-05-07 |
| 發(fā)明(設(shè)計)人: | 梁俊斌 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L19/02;G10L19/04;G10L19/08;G10L25/30 |
| 代理公司: | 深圳市隆天聯(lián)鼎知識產(chǎn)權(quán)代理有限公司 44232 | 代理人: | 葉虹 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 解碼 方法 裝置 介質(zhì) 電子設(shè)備 | ||
本申請屬于音頻編解碼技術(shù)領(lǐng)域,具體涉及一種音頻編解碼方法、裝置、介質(zhì)以及電子設(shè)備。音頻編碼方法包括:對待編碼音頻進行子帶分解以得到對應(yīng)于低頻頻段的待編碼低頻信號和對應(yīng)于高頻頻段的待編碼高頻信號;對待編碼低頻信號進行壓縮編碼以得到待編碼低頻信號的低頻編碼數(shù)據(jù);根據(jù)低頻信號與高頻信號的相關(guān)性獲取與待編碼低頻信號相對應(yīng)的高頻預(yù)測信息;對待編碼高頻信號進行特征提取以得到待編碼高頻信號的高頻特征信息,并根據(jù)高頻特征信息與高頻預(yù)測信息的差異確定待編碼高頻信號的高頻補償信息;對低頻編碼數(shù)據(jù)以及高頻補償信息進行封裝處理以得到待編碼音頻的音頻編碼數(shù)據(jù)。該方法可以壓縮高頻信號的編碼碼率并保證高頻信號的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請屬于音頻編解碼技術(shù)領(lǐng)域,并涉及人工智能技術(shù)。具體而言,本申請涉及一種音頻編碼方法、音頻解碼方法、音頻編碼裝置、音頻解碼裝置、計算機可讀介質(zhì)以及電子設(shè)備。
背景技術(shù)
音頻編解碼在現(xiàn)代通訊系統(tǒng)中占有重要的地位,通過對音頻數(shù)據(jù)進行壓縮編碼處理可以降低音頻數(shù)據(jù)在網(wǎng)絡(luò)傳輸中的網(wǎng)絡(luò)帶寬壓力,節(jié)省音頻數(shù)據(jù)的存儲成本和傳輸成本。
音樂、語音等音頻數(shù)據(jù)的頻譜主要集中在低頻段,高頻段幅度很小。如果對整個頻段編碼,若是為了保護高頻段數(shù)據(jù)就會造成低頻段數(shù)據(jù)編碼過細而導(dǎo)致編碼文件數(shù)據(jù)量巨大,難以取得理想的壓縮編碼效果;若是保存了低頻段數(shù)據(jù)的主要成分而丟棄高頻段數(shù)據(jù)成分則會喪失音質(zhì),導(dǎo)致音頻在解碼后出現(xiàn)嚴(yán)重的失真問題。因此,如何在音頻數(shù)據(jù)的編解碼過程中盡可能地保證高頻段數(shù)據(jù)的準(zhǔn)確傳輸是目前亟待解決的問題。
需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強對本申請的背景的理解,因此可以包括不構(gòu)成對本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
發(fā)明內(nèi)容
本申請的目的在于提供一種音頻編碼方法、音頻解碼方法、音頻編碼裝置、音頻解碼裝置、計算機可讀介質(zhì)以及電子設(shè)備,至少在一定程度上克服音頻編解碼技術(shù)中存在的高頻段音頻數(shù)據(jù)成分丟失、傳輸準(zhǔn)確性差等技術(shù)問題。
本申請的其他特性和優(yōu)點將通過下面的詳細描述變得顯然,或部分地通過本申請的實踐而習(xí)得。
根據(jù)本申請實施例的一個方面,提供一種音頻編碼方法,該方法包括:對待編碼音頻進行子帶分解以得到對應(yīng)于低頻頻段的待編碼低頻信號和對應(yīng)于高頻頻段的待編碼高頻信號;對所述待編碼低頻信號進行壓縮編碼以得到所述待編碼低頻信號的低頻編碼數(shù)據(jù);根據(jù)低頻信號與高頻信號的相關(guān)性獲取與所述待編碼低頻信號相對應(yīng)的高頻預(yù)測信息;對所述待編碼高頻信號進行特征提取以得到所述待編碼高頻信號的高頻特征信息,并根據(jù)所述高頻特征信息與所述高頻預(yù)測信息的差異確定所述待編碼高頻信號的高頻補償信息;對所述低頻編碼數(shù)據(jù)以及所述高頻補償信息進行封裝處理以得到所述待編碼音頻的音頻編碼數(shù)據(jù)。
根據(jù)本申請實施例的一個方面,提供一種音頻編碼裝置,該裝置包括:音頻分解模塊,被配置為對待編碼音頻進行子帶分解以得到對應(yīng)于低頻頻段的待編碼低頻信號和對應(yīng)于高頻頻段的待編碼高頻信號;低頻編碼模塊,被配置為對所述待編碼低頻信號進行壓縮編碼以得到所述待編碼低頻信號的低頻編碼數(shù)據(jù);高頻預(yù)測模塊,被配置為根據(jù)低頻信號與高頻信號的相關(guān)性獲取與所述待編碼低頻信號相對應(yīng)的高頻預(yù)測信息;高頻補償模塊,被配置為對所述待編碼高頻信號進行特征提取以得到所述待編碼高頻信號的高頻特征信息,并根據(jù)所述高頻特征信息與所述高頻預(yù)測信息的差異確定所述待編碼高頻信號的高頻補償信息;編碼封裝模塊,被配置為對所述低頻編碼數(shù)據(jù)以及所述高頻補償信息進行封裝處理以得到所述待編碼音頻的音頻編碼數(shù)據(jù)。
在本申請的一些實施例中,基于以上技術(shù)方案,所述高頻預(yù)測模塊包括:音頻分類單元,被配置為對所述待編碼音頻進行分類處理以得到所述待編碼音頻的音頻類別信息;編碼端網(wǎng)絡(luò)獲取單元,被配置為根據(jù)所述音頻類別信息獲取基于低頻信號與高頻信號的相關(guān)性訓(xùn)練得到的高頻預(yù)測神經(jīng)網(wǎng)絡(luò);編碼端網(wǎng)絡(luò)映射單元,被配置為通過所述高頻預(yù)測神經(jīng)網(wǎng)絡(luò)對所述待編碼低頻信號進行映射處理以得到與所述待編碼低頻信號相對應(yīng)的高頻預(yù)測信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010592469.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





