[發(fā)明專利]一種基于人耳聽覺頻率尺度信號分解的音頻編解碼方法有效
| 申請?zhí)枺?/td> | 201911034162.6 | 申請日: | 2019-10-29 |
| 公開(公告)號: | CN110534119B | 公開(公告)日: | 2020-07-03 |
| 發(fā)明(設計)人: | 林志斌;劉曉峻;狄敏;吳寶佳 | 申請(專利權(quán))人: | 南京南大電子智慧型服務機器人研究院有限公司;江蘇南大電子信息技術(shù)股份有限公司 |
| 主分類號: | G10L19/00 | 分類號: | G10L19/00;G10L19/02;G10L19/032;G10L25/27 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 210019 江蘇省南京市建*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 聽覺 頻率 尺度 信號 分解 音頻 解碼 方法 | ||
本發(fā)明公開了一種基于人耳聽覺頻率尺度信號分解的音頻編解碼方法,為了較好的使用心理聲學模型,將線性頻域的處理結(jié)果折算到對應的人耳聽覺頻率尺度(Bark)上,用以控制線性頻域參數(shù)的量化誤差。直接在人耳聽覺頻率尺度上進行信號分解,實現(xiàn)時域信號在Bark尺度的投影計算,本發(fā)明采用基于人耳聽覺頻率尺度進行音頻信號的非均勻子帶分解,有效的利用人耳聽覺的心理聲學模型,提升了心理聲學模型計算精度和編解碼的效率,本發(fā)明的量化對象為子帶時域信號,在滿足音頻編解碼碼率的前提下將編解碼量化失真控制在心理聲學模型的參數(shù)允許范圍內(nèi),量化方式新穎且效率高。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于人耳聽覺頻率尺度信號分解的音頻編解碼方法,屬于語音處理技術(shù)領(lǐng)域。
背景技術(shù)
現(xiàn)有的音頻編解碼方法主要有針對語音的編解碼方法和針對通用音頻信號的編解碼方法。針對語音的編解碼方法中,若要在較低碼率下實現(xiàn)較好音質(zhì)的語音傳輸,均為基于碼激勵線性預測的核心編解碼方法,究其本質(zhì),是由于語音信號可用一個準確的信號生成模型來獲取,碼激勵線性預測核心方法能通過矢量量化的方式成功的將激勵信號和聲道模型參數(shù)進行數(shù)據(jù)壓縮。而針對通用音頻的編解碼方法,其基本核心均為感知編解碼方法,如果要實現(xiàn)高音質(zhì)的音頻數(shù)據(jù)傳輸,不可避免使用均勻子帶分解的頻率變換方法,如修正的余弦變換(MDCT)等,其原因在于其可以實現(xiàn)臨界降采樣的實數(shù)運算,并且變換結(jié)果和信號頻域信息有直接的關(guān)聯(lián),容易施加心理聲學模型。如典型的MPEG MP3為是一種通用型的音頻編解碼方法,包含了均勻子帶分解和MDCT兩種信號變換方式。從本質(zhì)上說,這種編解碼方法是變換域的編碼方式,編碼中量化的對象是MDCT變換結(jié)果,量化的依據(jù)則是在滿足碼率的前提下盡可能的把量化噪聲控制在心理聲學掩蔽曲線以下。然而,人耳心理聲學模型所對應的頻率尺度為非均勻特征,傳統(tǒng)的編解碼方法將線性頻域的處理結(jié)果折算到心理聲學模型對應的非均勻頻率尺度上,再根據(jù)非均勻頻率尺度中的擴散函數(shù)及純音度判別計算心理聲學掩蔽特征,用以提高編解碼效率。
發(fā)明內(nèi)容
發(fā)明目的:為了克服現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種基于人耳聽覺頻率尺度信號分解的音頻編解碼方法,通過對音頻信號的基于人耳聽覺頻率尺度的非均勻分解,精確計算心理聲學模型參數(shù),有效的提升通用型音頻編解碼壓縮效率和編解碼音質(zhì)。
技術(shù)方案:為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為:
一種基于人耳聽覺頻率尺度信號分解的音頻編解碼方法,包括以下步驟:
步驟1,獲取輸入音頻信號。將線性頻域的音頻信號折算到對應的人耳聽覺頻率尺度上,線性頻率和人耳聽覺頻率尺度變換關(guān)系如下:
(1)
其中,
在人耳聽覺頻率尺度上進行音頻信號分解,實現(xiàn)時域信號在人耳聽覺頻率尺度的投影計算:
(2)
其中,
步驟2,在人耳聽覺頻率尺度上進行音頻信號短時正交變換分解。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京南大電子智慧型服務機器人研究院有限公司;江蘇南大電子信息技術(shù)股份有限公司,未經(jīng)南京南大電子智慧型服務機器人研究院有限公司;江蘇南大電子信息技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911034162.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





