[發(fā)明專利]基于IntMDCT的無(wú)損音頻編碼方法、解碼方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410514084.0 | 申請(qǐng)日: | 2014-09-29 |
| 公開(kāi)(公告)號(hào): | CN104318926B | 公開(kāi)(公告)日: | 2018-08-31 |
| 發(fā)明(設(shè)計(jì))人: | 宋玉齡 | 申請(qǐng)(專利權(quán))人: | 四川九洲電器集團(tuán)有限責(zé)任公司 |
| 主分類號(hào): | G10L19/00 | 分類號(hào): | G10L19/00;G10L19/02;G10L19/24 |
| 代理公司: | 成都九鼎天元知識(shí)產(chǎn)權(quán)代理有限公司 51214 | 代理人: | 徐宏;辜強(qiáng) |
| 地址: | 621000 四*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 intmdct 無(wú)損 音頻 編碼 方法 解碼 | ||
本發(fā)明提供一種基于IntMDCT的無(wú)損音頻編碼方法、解碼方法,該編碼方法包括以下步驟:(1)將音頻時(shí)域信號(hào)x(k)進(jìn)行分幀,讀取得到單幀時(shí)域信號(hào)x(k),k=0,...,N?1,N為幀長(zhǎng);(2)對(duì)時(shí)域信號(hào)進(jìn)行IntMDCT變換,得到頻域信號(hào)X(m),m=0,...,N?1;(3)對(duì)頻域信號(hào)進(jìn)行Rice編碼得到編碼碼流;該解碼方法是編碼方法的逆過(guò)程,首先對(duì)輸入的碼流文件進(jìn)行Rice解碼,得到頻域信號(hào)X(m),m=0,...,N?1,然后再進(jìn)行IntMDCT的逆變換恢復(fù)出時(shí)域信號(hào)x(k),k=0,...,N?1。本發(fā)明不需要碼表即能自適應(yīng)得到編碼參數(shù),且壓縮率值比塊自適應(yīng)Rice更低,適用范圍更廣。
技術(shù)領(lǐng)域
本發(fā)明涉及無(wú)損音頻編、解碼領(lǐng)域,尤其是涉及一種基于IntMDCT的無(wú)損音頻編碼方法、解碼方法。
背景技術(shù)
無(wú)損音頻編碼是指對(duì)音頻信號(hào)進(jìn)行編碼來(lái)降低數(shù)據(jù)量并獲得低比特率,不考慮任何信息損失的情況,接收端能夠毫無(wú)差錯(cuò)的解碼出來(lái)。
國(guó)際上通常使用的無(wú)損音頻編碼框架主要包含兩個(gè)步驟:預(yù)測(cè)/變換和熵編碼。預(yù)測(cè)/變換實(shí)質(zhì)上是去除音頻信號(hào)的時(shí)間和空間上的相關(guān)性;而熵編碼是去除音頻信號(hào)間的統(tǒng)計(jì)相關(guān)性。
目前兩種主流的去相關(guān)技術(shù)主要有預(yù)測(cè)和變換。其中,預(yù)測(cè)是比較常用的方法。預(yù)測(cè)技術(shù)對(duì)于音頻編碼具有一定不足。許多音頻片段會(huì)周期性出現(xiàn)同樣的音調(diào),這種情況下,低階預(yù)測(cè)器不能有效進(jìn)行預(yù)測(cè),然而使用高階預(yù)測(cè)器也不能完全解決這一問(wèn)題,因?yàn)閮H使用一幀音頻信號(hào)通常不足以得到最佳的預(yù)測(cè)系數(shù),并且音頻信號(hào)常常同時(shí)伴有多個(gè)音調(diào),即使使用針對(duì)語(yǔ)音信號(hào)性能比較好的預(yù)測(cè)器也不會(huì)有所改善。在頻域編碼方面,提出了子帶編碼和變換編碼等技術(shù)。變換技術(shù)用于無(wú)損音頻編碼相對(duì)較晚,也得到比較優(yōu)異的壓縮率,但是大多數(shù)無(wú)損音頻編碼器仍使用線性預(yù)測(cè)技術(shù)較多,目前僅有LTAC、MPEG-4SLS以及一些無(wú)損音頻編碼對(duì)變換編碼技術(shù)進(jìn)行研究。
數(shù)字音頻編碼技術(shù)一般使用的熵編碼方法有:游程編碼(RLC,Run LengthCoding,也稱行程編碼),霍夫曼Huffman編碼,算術(shù)編碼以及由Huffman演變而來(lái)的Golomb/Rice編碼,其中Huffman應(yīng)用范圍最廣。Rice編碼算法是由Robert F.Rice于1979年提出的熵編碼算法,它針對(duì)Golomb編碼的一種特殊情況即m=2k,(k=0,1,...)提出了比較方便且性能較好的編碼方法。Rice編碼對(duì)于Laplacian拉普拉斯分布及幾何的概率參數(shù)ρ已知的情況下確實(shí)是一種最優(yōu)碼,但事實(shí)上,Rice編碼仍存在問(wèn)題:概率參數(shù)ρ必須已知,最優(yōu)碼的編碼參數(shù)s才能確定,但是實(shí)際上并不能對(duì)整個(gè)信源進(jìn)行充分估計(jì)得到最適合的ρ,進(jìn)而得到最優(yōu)Rice編碼參數(shù)s,因此ρ的確定直接影響著Rice編碼的效果。目前Rice編碼主要有兩種自適應(yīng)編碼方法:前向自適應(yīng)和后向自適應(yīng)。把前向自適應(yīng)編碼定義為:編碼器在編碼前先考察數(shù)據(jù)并測(cè)量統(tǒng)計(jì)編碼參數(shù)(通常是平均值),然后將參數(shù)值放入首部以供解碼器使用,最后再使用該參數(shù)對(duì)數(shù)據(jù)編碼并寫入比特流文件。通常,并不是要同時(shí)編碼所有數(shù)據(jù),因?yàn)槠鋷?lái)的延時(shí)和復(fù)雜度是實(shí)時(shí)應(yīng)用中不能承受的。一般使用的方法是“塊自適應(yīng)”編碼,即將數(shù)據(jù)分成小部分,即塊,并制定一些塊選擇規(guī)則,比如在SHORTEN、MPEG-4ALS中,對(duì)于每個(gè)塊,首先計(jì)算輸入數(shù)據(jù)的平均值μn,并使用式(其中常數(shù)C≈0.97)來(lái)估算Rice編碼參數(shù)s,然后使用參數(shù)s對(duì)塊內(nèi)數(shù)據(jù)值編碼,即對(duì)于與緩沖區(qū)內(nèi)容相匹配的數(shù)據(jù)部分統(tǒng)計(jì)得到參數(shù),并將編碼器調(diào)整到該參數(shù)。但是前向自適應(yīng)在實(shí)際應(yīng)用中存在一定問(wèn)題,歸結(jié)為以下兩點(diǎn):
(1)編碼器需要兩次通過(guò)每個(gè)數(shù)據(jù),這在一些應(yīng)用中會(huì)減慢編碼過(guò)程或增加隨機(jī)存取存儲(chǔ)器的開(kāi)銷,比如數(shù)碼相機(jī)中的圖像編碼;
(2)選取合適的塊長(zhǎng)度尺寸比較困難,如果塊尺寸太大,則統(tǒng)計(jì)量在塊內(nèi)會(huì)劇烈變化,而如果太小,則必須告知解碼器哪個(gè)參數(shù)用于編碼使得額外開(kāi)銷變得難以承擔(dān)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川九洲電器集團(tuán)有限責(zé)任公司,未經(jīng)四川九洲電器集團(tuán)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410514084.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 一種基于云計(jì)算的無(wú)損檢測(cè)系統(tǒng)
- 基于云計(jì)算的無(wú)損檢測(cè)系統(tǒng)
- 能量無(wú)損編碼方法和設(shè)備、音頻編碼方法和設(shè)備、能量無(wú)損解碼方法和設(shè)備、以及音頻解碼方法和設(shè)備
- 一種基于觸屏的無(wú)損數(shù)字傳輸系統(tǒng)
- 能量無(wú)損編碼方法和設(shè)備以及能量無(wú)損解碼方法和設(shè)備
- 能量無(wú)損編碼方法和設(shè)備以及能量無(wú)損解碼方法和設(shè)備
- 一種無(wú)損檢測(cè)控制裝置
- 一種智能無(wú)損檢測(cè)系統(tǒng)
- 一種預(yù)置式南蛇藤果全無(wú)損采摘分層裝載輕便背負(fù)裝置
- 一種泥料水分在線檢測(cè)系統(tǒng)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





