[發(fā)明專(zhuān)利]可分級(jí)音頻編碼、解碼的方法和裝置以及編解碼系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 200910237482.1 | 申請(qǐng)日: | 2009-11-09 |
| 公開(kāi)(公告)號(hào): | CN101710489A | 公開(kāi)(公告)日: | 2010-05-19 |
| 發(fā)明(設(shè)計(jì))人: | 張波;竇維蓓 | 申請(qǐng)(專(zhuān)利權(quán))人: | 清華大學(xué) |
| 主分類(lèi)號(hào): | G10L19/02 | 分類(lèi)號(hào): | G10L19/02 |
| 代理公司: | 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 何文彬 |
| 地址: | 100084*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分級(jí) 音頻 編碼 解碼 方法 裝置 以及 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信源編碼和信號(hào)處理技術(shù)領(lǐng)域,特別涉及可分級(jí)音頻編碼、解 碼的方法和裝置以及編解碼系統(tǒng)。
背景技術(shù)
可分級(jí)音頻編碼的方法能夠在編碼端對(duì)音頻信號(hào)進(jìn)行高碼率壓縮,得到音 頻碼流,并且在解碼端能夠根據(jù)具體的用戶(hù)使用環(huán)境、內(nèi)容需求、設(shè)備性能(例 如帶寬)等從音頻碼流中恢復(fù)不同的保真度。另外,可分級(jí)音頻編碼的方法不用 分別保存相應(yīng)的音頻文件,能夠減少存儲(chǔ)量,此外,對(duì)分級(jí)后的音頻碼流加以 不對(duì)等保護(hù),從而能夠在帶寬不斷變化的網(wǎng)絡(luò)中提供不間斷的音頻服務(wù)?;? 上述優(yōu)點(diǎn)可分級(jí)音頻編碼的方法已被廣泛的應(yīng)用于音頻壓縮編碼。
現(xiàn)有技術(shù)提供了以下兩種可分級(jí)音頻編碼的方法,包括:
第一種,包括有核和無(wú)核兩種模式。在有核模式下,先采用AAC(Advanced Audio?Coding,高級(jí)音頻編碼)核心編碼器對(duì)音頻信號(hào)進(jìn)行壓縮編碼,得到基 本層碼流,同時(shí)經(jīng)過(guò)殘差映射得到每個(gè)變換系數(shù)的殘差;在無(wú)核模式下,每個(gè) 變換系數(shù)的殘差即為原始信號(hào)的頻譜。對(duì)以上兩種模式下的每個(gè)變換系數(shù)的殘 差做比特切割,得到位平面,其中,該位平面由子帶的位平面組成,根據(jù)每個(gè) 子帶的JND(just?noticeable?distortion,臨界可聞失真)計(jì)算每個(gè)子帶的位平面移位 量,并根據(jù)每個(gè)子帶的位平面移位量,對(duì)每個(gè)子帶的位平面向上平移,得到平 移后的位平面,然后對(duì)位平面進(jìn)行編碼得到增強(qiáng)層碼流,對(duì)基本層碼流和增強(qiáng) 層碼流進(jìn)行封裝,得到編碼后的音頻碼流。
第二種,采用AAC核心編碼器對(duì)音頻信號(hào)進(jìn)行高碼率壓縮,得到每個(gè)變換 系數(shù)的量化值,對(duì)每個(gè)變換系數(shù)的量化值做比特切割得到各頻帶的位平面,將 全頻帶劃分為若干編碼帶,從低頻編碼帶開(kāi)始,在各編碼帶內(nèi)按從低頻到高頻、 從最高比特位向最低比特位對(duì)位平面進(jìn)行編碼。其中,為保證基本層音質(zhì),在 編碼時(shí)定義了基本層的頻譜范圍;為提高效率,編碼時(shí)采用了基于上下文的位 平面編碼。
在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)存在如下的問(wèn)題:
上述第一種技術(shù),在有核模式下,在對(duì)增強(qiáng)層進(jìn)行編碼時(shí),沒(méi)有同時(shí)考慮 實(shí)際量化噪聲對(duì)音質(zhì)的影響,即不能優(yōu)先編碼最能改善音質(zhì)的子帶,增強(qiáng)層編 碼不滿(mǎn)足人耳聽(tīng)覺(jué)特性,不滿(mǎn)足音頻業(yè)務(wù)質(zhì)量可分級(jí)的要求;在對(duì)增強(qiáng)層進(jìn)行 編碼時(shí),還需要記錄每個(gè)子帶的位平面移位量,如此,增加系統(tǒng)額外碼率開(kāi)銷(xiāo)。
上述第二種技術(shù),在編碼時(shí),按照頻帶進(jìn)行分級(jí),沒(méi)有考慮到人耳對(duì)不同 子帶的主觀音質(zhì)的感受不同,即沒(méi)有優(yōu)先考慮對(duì)主觀音質(zhì)影響較大的子帶,編 碼器不滿(mǎn)足人耳聽(tīng)覺(jué)特性,不能滿(mǎn)足音頻業(yè)務(wù)質(zhì)量可分級(jí)的要求。
發(fā)明內(nèi)容
為了能夠減少系統(tǒng)額外碼率開(kāi)銷(xiāo),提高有限碼率下解碼后的音頻信號(hào)的音 質(zhì),本發(fā)明實(shí)施例提供了可分級(jí)音頻編碼、解碼的方法和裝置以及編解碼系統(tǒng)。 所述技術(shù)方案如下:
一種可分級(jí)音頻編碼的方法,所述方法包括:
通過(guò)對(duì)音頻信號(hào)壓縮編碼,獲得基本層碼流和每個(gè)子帶的噪聲遮蔽比NMR (Noise?to?Mask?Ratio,噪聲遮蔽比);
獲得所述音頻信號(hào)的增強(qiáng)層位平面,所述增強(qiáng)層位平面由各子帶的位平面 組成;
根據(jù)每個(gè)子帶的NMR獲取每個(gè)子帶的位平面移位量;
根據(jù)每個(gè)子帶的位平面移位量,將每個(gè)子帶的位平面向低比特位平移,得 到每個(gè)子帶的位平面優(yōu)先級(jí);
根據(jù)每個(gè)子帶的位平面優(yōu)先級(jí),對(duì)每個(gè)子帶的位平面進(jìn)行編碼,得到增強(qiáng) 層碼流;
對(duì)所述基本層碼流和所述增強(qiáng)層碼流進(jìn)行封裝,得到編碼后的音頻碼流。
所述獲得所述音頻信號(hào)的增強(qiáng)層位平面,具體包括:
根據(jù)所述音頻信號(hào)的每個(gè)變換系數(shù)和其所在子帶的比例因子,計(jì)算每個(gè)變 換系數(shù)的歸一化殘差;
對(duì)每個(gè)變換系數(shù)的歸一化殘差做預(yù)設(shè)數(shù)值比特的量化,得到所述增強(qiáng)層位 平面。
所述根據(jù)每個(gè)子帶的NMR獲取每個(gè)子帶的位平面移位量,具體包括:
從所有子帶的NMR中,查找最大的NMR;
將每個(gè)子帶的NMR與所述最大的NMR進(jìn)行比較,得到每個(gè)子帶的NMR 差值;
確定每個(gè)子帶的NMR差值所在的NMR差值范圍;
根據(jù)每個(gè)子帶的NMR差值范圍,從位平面移位量與NMR差值范圍的對(duì)應(yīng) 關(guān)系中查找每個(gè)子帶的位平面移位量。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910237482.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:漏電斷路器電源模塊
- 下一篇:醫(yī)用氧氣調(diào)節(jié)器
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 體征碼及其編碼方法
- 編碼裝置和編碼方法以及解碼裝置和解碼方法
- 聲音信號(hào)編碼方法、聲音信號(hào)解碼方法、編碼裝置、解碼裝置、聲音信號(hào)處理系統(tǒng)、聲音信號(hào)編碼程序以及聲音信號(hào)解碼程序
- 用于下一代視頻的編碼/未編碼的數(shù)據(jù)的內(nèi)容自適應(yīng)熵編碼
- 編碼光符號(hào)編碼
- 一種可變幀率的編碼方法及裝置
- 一種物聯(lián)網(wǎng)編碼方法及系統(tǒng)
- 點(diǎn)陣編碼及解碼方法
- 一種視頻編碼方法、裝置和存儲(chǔ)介質(zhì)
- 視頻編碼方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





